3月21日消息,2023年,大模型在全球范圍爆發(fā)式增長,經過一年的狂飆突進似發(fā)展后,業(yè)內普遍認為2024年是大模型應用落地元年。讓企業(yè)客戶愿意、能夠、有效的應用大模型能力,成為大模型企業(yè)思考的重點。
自2023年12月以來百度智能云千帆大模型平臺服務8萬企業(yè)用戶,累計幫助用戶精調1.3萬個大模型,幫助用戶開發(fā)出16萬個大模型應用。在這份成績的背后,百度智能云對服務企業(yè)落地大模型了也有了一套心法。
百度副總裁謝廣軍在接受媒體采訪時表示,2024年AI原生應用會加速落地,企業(yè)從探索場景逐步走到落地應用,這個時候會遇到模型性能、效果,以及在成本多方面的挑戰(zhàn)。綜合考量“大模型的使用效果、性能以及成本”即“效價比”,成為企業(yè)落地大模型的核心訴求。
百度副總裁謝廣軍
針對企業(yè)最關心的大模型落地場景、使用成本、應用開發(fā)、應用效果四大挑戰(zhàn),百度智能云千帆在大模型ModelBuilder、AI原生應用開發(fā)工具組件AppBuilder兩個方面給出了最新“解題思路”。
一方面,為滿足企業(yè)“效價比”核心訴求,百度千帆ModelBuilder大模型服務全面升級,全新發(fā)布3個輕量級大模型、2個垂直場景大模型。
另一方面,百度智能云對千帆AppBuilder組件能力全面升級,開放工具組件增至55個,進一步大幅降低AI原生應用開發(fā)門檻。
通過這兩條腿齊發(fā)力,以期加速大模型在企業(yè)業(yè)務中的應用落地。
上新5款大模型 最高推理調用成本下降53%
謝廣軍表示,當前業(yè)界已逐漸形成一個共識,即模型不見得是參數規(guī)模越大越好。在很多實際的場景當中,用小尺寸的專家模型也能夠達到通用大模型的效果,小尺寸專家模型的推理成本會更低,更便宜。大模型“效價比”才是企業(yè)核心訴求。
基于這樣的研究方向,百度智能云推出了三款輕量級大模型。
ERNIE Speed作為三款輕量級大模型中的“大個子”,推理場景下擁有最高128k的上下文長度,在處理知識問答等任務時,能夠更好的處理上下文的依賴關系,生成更加連貫和準確的預測或回答。同時,針對特定場景可以將ERNIE Speed作為基座模型進行精調,模型效果可以追平甚至超過旗艦級大參數規(guī)模大模型,效價比大幅提升。
ERNIE Lite,其參數量相比ERNIE Speed更小,也更加適合搭載在低算力的AI加速卡上處理推理任務,在兼顧模型效果與推理性能的同時,大幅降低客戶落地應用成本。作為ERNIE-Bot-turbo模型的升級版,ERNIE Lite在情感分析、多任務學習、自然推理等場景下的應用效果提升了20%。推理調用成本大幅下降了53%。
ERNIE Tiny,三款輕量級模型中參數量最小的大模型,為客戶提供了極致低成本、低延遲的最佳選擇。在檢索、推薦、意圖識別等高并發(fā)、低延時等應用場景中,ERNIE Tiny的優(yōu)異性能呈現了不俗表現。在某對話推薦業(yè)務場景中,精調后的ERNIE Tiny在搜索引擎推薦詞激發(fā)環(huán)節(jié),相比ERNIE 3.5,對話輪次增長了3.5%,成本下降了32%。
此外,企業(yè)在落地應用中,對大模型在人物扮演、外部工具調用均有更高的效果要求。本次千帆大模型平臺ModelBuilder還基于對企業(yè)場景的深入洞察,結合百度自身業(yè)務最佳實踐沉淀,推出了ERNIE Character和ERNIE Functions兩款垂直場景大模型,分別適配客戶在角色扮演類應用場景(如游戲NPC、客服對話等)和工具調用場景(對話中使用外部工具、調用業(yè)務函數等)中的使用需求。
謝廣軍介紹,在企業(yè)實踐中,某智能硬件廠商,基于ERNIE Character打造智能助理,應用該模型后在人設一致性、激發(fā)并提升用戶聊天欲望等方面效果顯著提升。某旅游出行類APP,使用ERNIE Functions打造智能客服助手,在執(zhí)行訂票、查詢航班狀態(tài)等多種function調用上準確性達到85%。
謝廣軍強調,新發(fā)布的三款輕量級模型主要有兩個使用場景:一是客戶、合作伙伴會結合自己的數據做垂類場景模型。一是百度也會基于這些小的基座模型,去開發(fā)一些行業(yè)垂類場景模型,比如做教育行業(yè)的教輔答題和解題等。
向量數據庫VDB 1.0亮相 開放工具組件達55個
千帆AppBuilder作為產業(yè)級AI原生應用開發(fā)平臺,是千帆的重要組成部分。
此次升級后的AppBuilder開放的工具組件多達55個。包括基于百度多年技術積累和自有業(yè)務沉淀的大模型組件、AI能力組件,也包括搜索等百度特色的業(yè)務組件、和多場景的第三方API工具,另外還提供了 RAG(知識檢索問答)、GBI(生成式數據分析)等根據典型應用場景深入調優(yōu)的高級能力組件。
開發(fā)完成后,應用可多渠道分發(fā)與集成,AppBuilder支持將應用一鍵分發(fā)到微信客服、微信公眾號、Web端/H5及百度靈境矩陣等主流渠道。基于百度靈境矩陣,應用可在百度搜索、百度信息流等主流場景分發(fā)與掛載。真正實現應用開發(fā)出來后,就直接觸達用戶,打通從AI原生應用創(chuàng)建到開發(fā)再到分發(fā)的全流程。
開發(fā)AI原生應用離不開云基礎設施,值得一提的是,本次發(fā)布的基礎組件還包括了百度智能云全新推出的向量數據庫VDB 1.0。
謝廣軍表示,大模型火了之后,向量數據庫重要性凸顯,它可以幫助減輕幻覺、解決數據數據更新等問題,也是加速大模型在場景落地的關鍵技術。
百度向量數據庫VDB1.0既是一項獨立存在的產品和服務,是百度智能云的一項基礎設施,也是作為一項基礎云的組件和能力封裝到了千帆AppBuilder里面。
謝廣軍強調:“當前大模型落地過程中,向量數據庫應用成本相對較高,企業(yè)在千帆AppBuilder中組件化利用向量數據庫的能力,是一個性價比兼具的方案,相比同類開源產品,VDB 1.0性能最高提升10倍,相比付費產品,則更省成本?!?/p>
模型路由,讓成本再降15%
會上,謝廣軍還透露了百度智能云的模型路由服務。百度智能云的模型路由是以降本為目的來做MOE。
謝廣軍表示,模型路由能夠幫助客戶在使用場景中,根據不同情況選擇不同的能力模型。小模型往往比較擅長垂類場景,但在實際使用過程中,這種場景會非常多,十分泛化,模型路由通過分流,讓在某一垂類問題上更專業(yè)的專家模型來回答,專業(yè)的模型解答專業(yè)的問題。相比旗艦模型或者更大尺寸的模型,小尺寸模型也能達到同樣甚至趕超的效果,提升性能的同時降成本。如果都不能回答,就讓大尺寸的模型或者旗艦模型來“兜底”。
據介紹,通過百度智能云的模型路由方案,有企業(yè)客戶的模型推理成本降低15%。
謝廣軍稱:“當前,ModelRouter已啟動邀測,一些手機廠商客戶在應用過程中已經感受到成本的下降,保證業(yè)務效果不降的情況下,將簡單的Query調度到更輕量級的模型上,使得綜合成本下降?!保ü啵?/p>
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- TechWeb一周熱點匯總:特斯拉下月量產改款Model Y,阿里“甩賣”銀泰
- 蔚來第三品牌firefly螢火蟲首款車型正式亮相 預售價14.88萬元
- 首發(fā)線控轉向等多項技術 蔚來旗艦車型ET9正式上市:78.8萬元起
- Fortinet李宏凱:2025年在中國大陸啟動SASE PoP節(jié)點部署 助力企業(yè)出海
- Fortinet李宏凱:2024年Fortinet全球客戶已超80萬
- 網信辦:從嚴打擊網上侵害未成年人合法權益行為
- 豆包大模型全面升級,相關概念股瘋漲,字節(jié)發(fā)布緊急警示
- TechWeb微晚報:“小紅書封號”沖上熱搜,小米YU7無偽裝實車首次曝光
- “小米SU7墜崖一家四口安然無恙”沖上熱搜 車主回應
- 奇富科技發(fā)布AI產品小奇等金融AI大模型成果
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。