10月31日消息,百川智能推出一站式大模型商業(yè)化解決方案,即1+3產(chǎn)品矩陣(全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù),Baichuan4-Turbo、Baichuan4-Air兩款模型和全鏈路領(lǐng)域增強(qiáng)工具鏈),該方案“工具多、速度快、效果好、成本低”,能夠幫助企業(yè)以最低成本實(shí)現(xiàn)效果最佳的私有化部署。并支持企業(yè)將專有數(shù)據(jù)與百川智能自用的全鏈路優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)混合,對(duì)Baichuan4-Turbo、Baichuan4-Air兩款模型進(jìn)行調(diào)優(yōu)和增強(qiáng),實(shí)現(xiàn)了行業(yè)最高的96%多場(chǎng)景可用率。
企業(yè)多元場(chǎng)景可用率高達(dá)96%
眾所周知,盡管大模型具備良好的泛化能力,但由于每個(gè)企業(yè)都有自身獨(dú)特的專業(yè)知識(shí)和應(yīng)用場(chǎng)景,直接應(yīng)用通用模型無(wú)法達(dá)到理想效果,必須對(duì)模型進(jìn)行定制化優(yōu)化使其適應(yīng)特定領(lǐng)域和場(chǎng)景需求,而優(yōu)化后模型在多場(chǎng)景下的可用率是評(píng)估其價(jià)值的關(guān)鍵標(biāo)準(zhǔn)。此前行業(yè)的主流做法是將企業(yè)專有數(shù)據(jù)和通用數(shù)據(jù)混合定向調(diào)優(yōu)、增強(qiáng)通用模型,但受限于諸多因素,企業(yè)很難獲得與原模型高度匹配的通用訓(xùn)練數(shù)據(jù),因此即便經(jīng)過(guò)調(diào)優(yōu),模型也有很大概率會(huì)失去通用性,變成無(wú)法應(yīng)對(duì)多個(gè)場(chǎng)景的專用模型。
為解決這一關(guān)鍵難題,百川智能將自用的優(yōu)質(zhì)預(yù)訓(xùn)練數(shù)據(jù)、SFT微調(diào)數(shù)據(jù)、強(qiáng)化學(xué)習(xí)中的通用訓(xùn)練數(shù)據(jù),以及自研的超參自動(dòng)化搜索和調(diào)優(yōu)技術(shù)、數(shù)據(jù)動(dòng)態(tài)自適應(yīng)配比技術(shù)等統(tǒng)一封裝,打造了一套全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)方案。
由于Baichuan4-Turbo、Baichuan4-Air均為百川智能自研,所以這些優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)與兩者的數(shù)據(jù)分布高度一致,結(jié)合超參動(dòng)態(tài)搜索和自適應(yīng)配比等算法,與企業(yè)私有數(shù)據(jù)混合微調(diào),顯著提升了兩個(gè)模型多場(chǎng)景下的可用率,在金融、教育、醫(yī)療等場(chǎng)景下的專業(yè)細(xì)分任務(wù)平均可用率高達(dá) 96%,位居行業(yè)首位。
Baichuan4-Turbo部署成本、Baichuan4-Air推理成本均為行業(yè)同梯隊(duì)最低
成本是影響企業(yè)應(yīng)用大模型的另一個(gè)重要因素,不同場(chǎng)景階段,企業(yè)對(duì)模型性能和成本的要求各不相同。為更好滿足行業(yè)用戶的多樣化需求,百川智能對(duì)兩個(gè)模型進(jìn)行了差異化定位。
具體而言,Baichuan4-Turbo的文本生成、知識(shí)問(wèn)答、多語(yǔ)言處理等核心能力相比Baichuan 4均有顯著提升,只需2卡4090的算力即可完成部署,在 GPT—4o同檔位效果的模型中部署成本最低,非常適合企業(yè)探索復(fù)雜場(chǎng)景。而B(niǎo)aichuan4-Air則更適用于已經(jīng)驗(yàn)證過(guò)的較大規(guī)模流量的場(chǎng)景,其效果與Baichuan 4基本持平,但推理成本行業(yè)最低,僅為Baichuan 4的1%,百萬(wàn)Token只需0.98元。
此外,兩款模型的響應(yīng)速度也均提升顯著,相比Baichuan 4,Baichuan4-Turbo首Token速度提升51%、Token流速提升73%;Baichuan4-Air的首Token速度提升77%、Token流速提升93%。
值得一提的是,作為百川智能的首個(gè)MoE(Mixture of Experts)模型,Baichuan 4-Air首創(chuàng)了PRI(Pyramid、Residual、Interval)架構(gòu)。與標(biāo)準(zhǔn)的MoE架構(gòu)相比,Baichuan4-Air保持了MLP(多層感知機(jī))和Attention(注意力機(jī)制)的內(nèi)部結(jié)構(gòu)不變,僅對(duì)混合專家MLP層的配置方式進(jìn)行優(yōu)化,通過(guò)合理配置專家數(shù)量和激活策略,能夠更好地平衡計(jì)算負(fù)載,減少計(jì)算量,提高推理速度。在相同訓(xùn)練數(shù)據(jù)下,Baichuan4-Air不僅時(shí)效率更高,性能也大幅領(lǐng)先于GPT4-style、Mixtral-style結(jié)構(gòu)的MoE模型。
Baichuan4-Air的時(shí)效率對(duì)比測(cè)試效果圖
企業(yè)在部署模型過(guò)程中還面臨著專業(yè)算法人才稀缺,模型調(diào)優(yōu)技術(shù)門檻高等阻礙。面向這些痛點(diǎn),百川智能打造了簡(jiǎn)單易用的全鏈路領(lǐng)域增強(qiáng)工具鏈。該工具鏈集成了數(shù)據(jù)抓取、數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)、模型訓(xùn)練、模型評(píng)測(cè)、模型壓縮和模型部署等諸多工具,企業(yè)可以根據(jù)自身需求自由選擇相應(yīng)工具,對(duì)模型進(jìn)行加密部署和訓(xùn)練。
此外,百川智能還通過(guò)大量適配工作解決了不同硬件的適配問(wèn)題,目前能夠高效適配英偉達(dá)4090/A/H系列、華為昇騰、寒武紀(jì)、高通、MTK、天數(shù)等多種主流芯片。
據(jù)悉,目前百川智能已經(jīng)服務(wù)了數(shù)千家客戶, 包括北電數(shù)智、完美世界游戲、愛(ài)奇藝、360集團(tuán)、生學(xué)教育、愛(ài)學(xué)堂等各行業(yè)的領(lǐng)軍企業(yè),并且與信雅達(dá)、用友、軟通動(dòng)力、新致軟件、達(dá)觀數(shù)據(jù)、華勝天成等多家行業(yè)生態(tài)伙伴,以及華為、中科曙光等硬件廠商,中國(guó)移動(dòng)、中國(guó)電信、中國(guó)聯(lián)通等運(yùn)營(yíng)商達(dá)成合作,攜手構(gòu)建百川大模型生態(tài)。(宜月)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )