4月16日,Create 2024 百度AI開發(fā)者大會在深圳召開。期間,百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖正式發(fā)布新一代智能計算操作系統(tǒng)——萬源,通過對AI原生時代的智能計算平臺進行抽象與封裝設(shè)計,為用戶屏蔽掉云原生系統(tǒng)與異構(gòu)算力的復雜性,提升AI原生應用開發(fā)效率與體驗。
沈抖表示,隨著大模型技術(shù)的不斷演進,通過自然語言進行編程正在成為現(xiàn)實。編程將不再面向過程或者面向?qū)ο?,而是面向需求;編程的過程將成為開發(fā)者表達愿望的過程,并為操作系統(tǒng)帶來革命性的變化。在操作系統(tǒng)的內(nèi)核中,底層硬件從以CPU算力為主變成以GPU算力為主,并且新增了被大模型壓縮的世界知識。操作系統(tǒng)管理的對象發(fā)生了本質(zhì)的變化,從管理進程、管理微服務,進化為管理智能。
(百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖)
“傳統(tǒng)的云計算系統(tǒng)依然重要,但不再是主角,我們需要一個全新的操作系統(tǒng),對新的計算平臺,也就是智能計算做好抽象和封裝,重新定義人機交互,為開發(fā)者提供更簡單、更流暢的開發(fā)體驗?!鄙蚨度缡钦f。
(百度智能云發(fā)布新一代智能計算操作系統(tǒng)——萬源)
本次大會上,百度智能云全新推出的“萬源”智能計算操作系統(tǒng),旨在“橋接”算力效能與應用創(chuàng)新。具體來講,萬源主要由Kernel(內(nèi)核)、Shell(外殼)、Toolkit(工具)三層構(gòu)成,底層屏蔽掉云原生系統(tǒng)與異構(gòu)算力的復雜性,上層則為AI原生應用的敏捷開發(fā)提供支撐與保障。
首先,在內(nèi)核層,在算力資源管理方面,百度百舸·AI異構(gòu)計算平臺針對大模型訓練、推理等任務,對智算集群的設(shè)計、調(diào)度、容錯等環(huán)節(jié)進行了專項優(yōu)化。目前,百舸能夠?qū)崿F(xiàn)萬卡集群上的模型有效訓練時長占比超過98.8%,線性加速比、帶寬有效性分別高達95%,算力效能業(yè)界領(lǐng)先。
此外,百舸還兼容昆侖芯、昇騰、海光DCU、英偉達、英特爾等國內(nèi)外主流AI芯片,支持用戶以最小代價完成算力適配。相比模型推理,“一云多芯”在模型訓練場景中是極難攻堅的難題,主要包含兩類細分場景:
1、智算集群中存在多個訓練任務,單一廠商芯片只服務單一任務;
2、在每個獨立的模型訓練任務中同時使用不同廠商芯片。這就需要解決不同廠商芯片算力均勻切分、芯片間通信效率優(yōu)化等問題,難度極高。
(業(yè)界領(lǐng)先的單一任務一云多芯大模型訓練解決方案)
目前,百舸已經(jīng)實現(xiàn)了單一訓練任務下不同廠商芯片的混合訓練,且百卡規(guī)模性能損失不超過3%,千卡規(guī)模性能損失不超過5%,業(yè)界領(lǐng)先。最大程度上屏蔽硬件之間差異,幫助用戶擺脫單一芯片的依賴,實現(xiàn)更優(yōu)成本,打造更具彈性的供應鏈體系。
萬源內(nèi)核中的另一個重要組成部分是大模型。大模型能夠?qū)⒕蘖康氖澜缰R進行高效壓縮,并將自然語言的理解、生成、邏輯、記憶能力進行封裝。目前,萬源內(nèi)核中既包含了業(yè)界領(lǐng)先的ERNIE 4.0、ERNIE 3.5大語言模型,也包括ERNIE Speed/Lite/Tiny等輕量級模型、文心視覺大模型和各具特色的第三方大模型,充分滿足用戶在不同業(yè)務場景下的多樣化需求。
在內(nèi)核層之上是Shell層,通過百度智能云千帆ModelBuilder解決內(nèi)核中模型的管理、調(diào)度、二次開發(fā)等問題,屏蔽掉模型開發(fā)的復雜性,幫助更多人只投入少量的數(shù)據(jù)、資源和精力,就能快速精調(diào)出適合自己業(yè)務的模型。同時,在實際應用中,ModelBuidler提供的模型路由服務,能夠自動為不同難度的任務選擇合適參數(shù)規(guī)模的模型,給出平衡效果與成本的最優(yōu)模型組合。經(jīng)測算,在模型效果基本持平的情況下,模型路由平均降低推理成本多達30%!
在Shell層之上,千帆AppBuilder和AgentBuilder共同構(gòu)成了工具層,為開發(fā)者提供強大的AI原生應用開發(fā)能力。尤其是AppBuilder提供的工作流編排功能,支持開發(fā)者使用預置的模板和組件,輕松定制自己的業(yè)務流程,還能夠集成、擴建自己的特色組件,在不同節(jié)點上選用適合的模型,通過靈活的編排實現(xiàn)業(yè)務邏輯。
在AppBuilder上開發(fā)AI原生應用的過程中,還可以直接調(diào)用通過ModelBuilder精調(diào)過的模型,讓整個開發(fā)過程變得極為流暢和便捷。在應用開發(fā)完成后,可以一鍵發(fā)布到百度搜索、微信公眾號等平臺,也可以通過API或SDK的方式直接集成到用戶自己的系統(tǒng)中,真正做到極速開發(fā)、輕松上市。
萬源作為開放的操作系統(tǒng),未來還將進一步開放生態(tài)合作,為應用開發(fā)者提供更多能力和接口;助力企業(yè)打造專屬的垂直行業(yè)操作系統(tǒng);將萬源部署在客戶自有智算中心,提供穩(wěn)定、安全、高效的智能計算平臺服務;適配更多廠商異構(gòu)芯片并發(fā)揮其最大效能。
當前,大模型技術(shù)與AI原生應用正在促使云服務向以AI為核心的新一代智能計算操作系統(tǒng)方向發(fā)展,這一趨勢不僅反映了技術(shù)發(fā)展的內(nèi)在邏輯,也體現(xiàn)了市場需求的強勁推力,并開啟一個由AI驅(qū)動的嶄新的智能云時代。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。