10月31日消息,百川智能推出一站式大模型商業(yè)化解決方案,即1+3產(chǎn)品矩陣(全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù),Baichuan4-Turbo、Baichuan4-Air兩款模型和全鏈路領(lǐng)域增強(qiáng)工具鏈),該方案“工具多、速度快、效果好、成本低”,能夠幫助企業(yè)以最低成本實(shí)現(xiàn)效果最佳的私有化部署。并支持企業(yè)將專有數(shù)據(jù)與百川智能自用的全鏈路優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)混合,對(duì)Baichuan4-Turbo、Baichuan4-Air兩款模型進(jìn)行調(diào)優(yōu)和增強(qiáng),實(shí)現(xiàn)了行業(yè)最高的96%多場(chǎng)景可用率。
企業(yè)多元場(chǎng)景可用率高達(dá)96%
眾所周知,盡管大模型具備良好的泛化能力,但由于每個(gè)企業(yè)都有自身獨(dú)特的專業(yè)知識(shí)和應(yīng)用場(chǎng)景,直接應(yīng)用通用模型無(wú)法達(dá)到理想效果,必須對(duì)模型進(jìn)行定制化優(yōu)化使其適應(yīng)特定領(lǐng)域和場(chǎng)景需求,而優(yōu)化后模型在多場(chǎng)景下的可用率是評(píng)估其價(jià)值的關(guān)鍵標(biāo)準(zhǔn)。此前行業(yè)的主流做法是將企業(yè)專有數(shù)據(jù)和通用數(shù)據(jù)混合定向調(diào)優(yōu)、增強(qiáng)通用模型,但受限于諸多因素,企業(yè)很難獲得與原模型高度匹配的通用訓(xùn)練數(shù)據(jù),因此即便經(jīng)過(guò)調(diào)優(yōu),模型也有很大概率會(huì)失去通用性,變成無(wú)法應(yīng)對(duì)多個(gè)場(chǎng)景的專用模型。
為解決這一關(guān)鍵難題,百川智能將自用的優(yōu)質(zhì)預(yù)訓(xùn)練數(shù)據(jù)、SFT微調(diào)數(shù)據(jù)、強(qiáng)化學(xué)習(xí)中的通用訓(xùn)練數(shù)據(jù),以及自研的超參自動(dòng)化搜索和調(diào)優(yōu)技術(shù)、數(shù)據(jù)動(dòng)態(tài)自適應(yīng)配比技術(shù)等統(tǒng)一封裝,打造了一套全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)方案。
由于Baichuan4-Turbo、Baichuan4-Air均為百川智能自研,所以這些優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)與兩者的數(shù)據(jù)分布高度一致,結(jié)合超參動(dòng)態(tài)搜索和自適應(yīng)配比等算法,與企業(yè)私有數(shù)據(jù)混合微調(diào),顯著提升了兩個(gè)模型多場(chǎng)景下的可用率,在金融、教育、醫(yī)療等場(chǎng)景下的專業(yè)細(xì)分任務(wù)平均可用率高達(dá) 96%,位居行業(yè)首位。
Baichuan4-Turbo部署成本、Baichuan4-Air推理成本均為行業(yè)同梯隊(duì)最低
成本是影響企業(yè)應(yīng)用大模型的另一個(gè)重要因素,不同場(chǎng)景階段,企業(yè)對(duì)模型性能和成本的要求各不相同。為更好滿足行業(yè)用戶的多樣化需求,百川智能對(duì)兩個(gè)模型進(jìn)行了差異化定位。
具體而言,Baichuan4-Turbo的文本生成、知識(shí)問(wèn)答、多語(yǔ)言處理等核心能力相比Baichuan 4均有顯著提升,只需2卡4090的算力即可完成部署,在 GPT—4o同檔位效果的模型中部署成本最低,非常適合企業(yè)探索復(fù)雜場(chǎng)景。而B(niǎo)aichuan4-Air則更適用于已經(jīng)驗(yàn)證過(guò)的較大規(guī)模流量的場(chǎng)景,其效果與Baichuan 4基本持平,但推理成本行業(yè)最低,僅為Baichuan 4的1%,百萬(wàn)Token只需0.98元。
此外,兩款模型的響應(yīng)速度也均提升顯著,相比Baichuan 4,Baichuan4-Turbo首Token速度提升51%、Token流速提升73%;Baichuan4-Air的首Token速度提升77%、Token流速提升93%。
值得一提的是,作為百川智能的首個(gè)MoE(Mixture of Experts)模型,Baichuan 4-Air首創(chuàng)了PRI(Pyramid、Residual、Interval)架構(gòu)。與標(biāo)準(zhǔn)的MoE架構(gòu)相比,Baichuan4-Air保持了MLP(多層感知機(jī))和Attention(注意力機(jī)制)的內(nèi)部結(jié)構(gòu)不變,僅對(duì)混合專家MLP層的配置方式進(jìn)行優(yōu)化,通過(guò)合理配置專家數(shù)量和激活策略,能夠更好地平衡計(jì)算負(fù)載,減少計(jì)算量,提高推理速度。在相同訓(xùn)練數(shù)據(jù)下,Baichuan4-Air不僅時(shí)效率更高,性能也大幅領(lǐng)先于GPT4-style、Mixtral-style結(jié)構(gòu)的MoE模型。
Baichuan4-Air的時(shí)效率對(duì)比測(cè)試效果圖
企業(yè)在部署模型過(guò)程中還面臨著專業(yè)算法人才稀缺,模型調(diào)優(yōu)技術(shù)門檻高等阻礙。面向這些痛點(diǎn),百川智能打造了簡(jiǎn)單易用的全鏈路領(lǐng)域增強(qiáng)工具鏈。該工具鏈集成了數(shù)據(jù)抓取、數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)、模型訓(xùn)練、模型評(píng)測(cè)、模型壓縮和模型部署等諸多工具,企業(yè)可以根據(jù)自身需求自由選擇相應(yīng)工具,對(duì)模型進(jìn)行加密部署和訓(xùn)練。
此外,百川智能還通過(guò)大量適配工作解決了不同硬件的適配問(wèn)題,目前能夠高效適配英偉達(dá)4090/A/H系列、華為昇騰、寒武紀(jì)、高通、MTK、天數(shù)等多種主流芯片。
據(jù)悉,目前百川智能已經(jīng)服務(wù)了數(shù)千家客戶, 包括北電數(shù)智、完美世界游戲、愛(ài)奇藝、360集團(tuán)、生學(xué)教育、愛(ài)學(xué)堂等各行業(yè)的領(lǐng)軍企業(yè),并且與信雅達(dá)、用友、軟通動(dòng)力、新致軟件、達(dá)觀數(shù)據(jù)、華勝天成等多家行業(yè)生態(tài)伙伴,以及華為、中科曙光等硬件廠商,中國(guó)移動(dòng)、中國(guó)電信、中國(guó)聯(lián)通等運(yùn)營(yíng)商達(dá)成合作,攜手構(gòu)建百川大模型生態(tài)。(宜月)
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型Baichuan4-Finance,整體準(zhǔn)確率領(lǐng)先GPT-4o近20%
- 央視曝光未成年人可輕松繞開(kāi)“防沉迷”系統(tǒng):租號(hào)玩游戲最低僅需4元
- 知乎發(fā)布2024“年度十問(wèn)”:《黑神話:悟空》、諾貝爾物理學(xué)獎(jiǎng)等問(wèn)題在列
- 李斌回應(yīng)螢火蟲(chóng)三重奏大燈設(shè)計(jì):沒(méi)有參考iPhone
- 一周熱點(diǎn)匯總:特斯拉下月量產(chǎn)改款Model Y,阿里“甩賣”銀泰
- 蔚來(lái)第三品牌firefly螢火蟲(chóng)首款車型正式亮相 預(yù)售價(jià)14.88萬(wàn)元
- 首發(fā)線控轉(zhuǎn)向等多項(xiàng)技術(shù) 蔚來(lái)旗艦車型ET9正式上市:78.8萬(wàn)元起
- 網(wǎng)信辦:從嚴(yán)打擊網(wǎng)上侵害未成年人合法權(quán)益行為
- 豆包大模型全面升級(jí),相關(guān)概念股瘋漲,字節(jié)發(fā)布緊急警示
- “小紅書(shū)封號(hào)”沖上熱搜,小米YU7無(wú)偽裝實(shí)車首次曝光
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。