9月25日消息,百川智能發(fā)布Baichuan2-53B 閉源大模型,全面升級了Baichuan1-53B的各項能力。Baichuan2-53B不僅數(shù)學(xué)和邏輯推理能力提升顯著,還通過高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)極大降低了模型幻覺。
作為首批通過備案的大模型企業(yè),百川智能此次還開放了Baichuan2-53B API接口,正式進(jìn)軍To B領(lǐng)域,開啟商業(yè)化進(jìn)程。此次開放API后,百川智能將把行業(yè)領(lǐng)先的大模型能力賦能給各行各業(yè)的合作伙伴,助力萬千企業(yè)智能化發(fā)展。
Baichuan2-53B 是百川智能發(fā)布的第6款大模型,自4月10日成立以來,該公司以平均每28天推出一個大模型的速度持續(xù)創(chuàng)新。不久之前發(fā)布的Baichuan 2開源大模型在多項評估任務(wù)中大幅領(lǐng)先 LLaMA2。
數(shù)學(xué)和邏輯推理能力大幅提升
百川智能于2023年8月8日發(fā)布Baichuan-53B搜索增強(qiáng)大模型,模型在知識問答、文學(xué)創(chuàng)作等方面表現(xiàn)優(yōu)異,展現(xiàn)出商業(yè)文案創(chuàng)作(郵件撰寫、公司命名、營銷文案生成)、文學(xué)創(chuàng)作(故事續(xù)寫、詩詞創(chuàng)作)、中文理解(語義識別、成語含義、詩詞分析)等多種任務(wù)場景下的強(qiáng)大能力。
大模型的數(shù)學(xué)和邏輯推理能力一直是業(yè)內(nèi)的關(guān)注焦點,也是評價一款大模型是否領(lǐng)先的重要指標(biāo)。在Baichuan-53B的基礎(chǔ)上,Baichuan2-53B不僅重點強(qiáng)化了以上兩個維度的能力,并且對整體能力進(jìn)行了全面升級。其中,邏輯推理能力提升100%,數(shù)學(xué)能力提升31%,語言理解能力提升29%,文本創(chuàng)作提升18%,知識問答提升9%。
客觀問答準(zhǔn)確率行業(yè)領(lǐng)先
幻覺是大模型落地應(yīng)用必須跨越的鴻溝。通常而言,解決這一問題有兩種方式,一種是不斷增加模型的數(shù)據(jù)規(guī)模、提升數(shù)據(jù)質(zhì)量;另一種是通過調(diào)用搜索等外部工具讓模型能夠獲取實時信息。
據(jù)悉,Baichuan2-53B在兩個方面均做了大量優(yōu)化。高質(zhì)量數(shù)據(jù)構(gòu)建方面,Baichuan2-53B獨創(chuàng)了一套數(shù)據(jù)質(zhì)量體系。以低質(zhì)、優(yōu)質(zhì)為標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行分類,確保Baichuan-53B始終使用優(yōu)質(zhì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。
信息獲取方面,Baichuan2-53B對多個模塊進(jìn)行了升級,包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等關(guān)鍵組件。這一綜合體系通過深入理解用戶指令,精確驅(qū)動查詢詞的搜索,最終結(jié)合大語言模型技術(shù),優(yōu)化模型結(jié)果生成的可靠性,實現(xiàn)更精確、更智能的模型回答結(jié)果,減少模型幻覺。
在高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)技術(shù)的加持下,Baichuan2-53B有效降低了模型幻覺。百川智能使用 FacTool 評測后的結(jié)果顯示,Baichuan2-53B 的綜合得分為140.5,在主流基礎(chǔ)大模型中僅排在GPT-4之后,處于國內(nèi)領(lǐng)先水平。
FacTool是由上海交通大學(xué)、卡內(nèi)基梅隆大學(xué)、香港城市大學(xué)、Meta 等機(jī)構(gòu)學(xué)者共同提出的一款通用框架(項目地址:https://github.com/GAIR-NLP/factool),能夠查核大模型生成內(nèi)容的事實準(zhǔn)確性(也能查核一般性內(nèi)容的事實準(zhǔn)確性)。
開放API, 全面進(jìn)軍To B領(lǐng)域
除了能力全面升級,Baichuan2-53B 還開放了API接口,企業(yè)和開發(fā)者可以通過API將Baichuan2-53B集成至他們的應(yīng)用程序和服務(wù)中。Baichuan2-53B融合了最前沿的大模型技術(shù),可以很好的適配不同企業(yè)的各種業(yè)務(wù)需求,無論是智能客服、智能寫作還是智能推薦都能打造行業(yè)領(lǐng)先的用戶體驗。
據(jù)介紹,Baichuan2-53B的API接口便捷易用,客戶只需要簡單的配置和集成即可接入,同時其對OpenAI的接口高度兼容,客戶可以快速遷移,極大降低了模型的部署和轉(zhuǎn)換成本。
同時,百川智能強(qiáng)調(diào),對于企業(yè)用戶最關(guān)注的安全合規(guī)問題,作為首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型企業(yè),百川智能為Baichuan2-53B打造了覆蓋大模型預(yù)訓(xùn)練、精調(diào)、推理全周期的安全增強(qiáng),能夠為客戶和合作伙伴提供全流程的安全保障。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )