大模型,是今年全球科技界最火熱,最耀眼的關鍵詞。在幾個月的狂飆突進中,全球主要科技公司紛紛加入了大模型領域。中國AI產業(yè)更是開啟了被戲稱為“百模大戰(zhàn)”的盛況。
但喧囂與熱鬧之后,新的問題也隨之而來:大模型的力量究竟能否持續(xù)發(fā)展?在擁有了許多大模型之后,我們又該做些什么?
簡單來說,面向機遇與挑戰(zhàn)并重的大模型時代,中國AI需要從拼參數(shù)、拼數(shù)量的“短期主義”中走出來,走向長期發(fā)展與生態(tài)凝聚。
有大模型并不難,難的是讓大模型走向遠方。
8月16日,由深度學習技術及應用國家工程研究中心主辦的WAVE SUMMIT深度學習開發(fā)者大會2023在北京舉行。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰表示,大語言模型具備了理解、生成、邏輯、記憶等人工智能的核心基礎能力,為通用人工智能帶來曙光。
如果要總結這一屆WAVE SUMMIT,那么在我看來,最重要的價值是百度展示了大模型如何走向“長期主義”發(fā)展模式。通過文心加飛槳,為產業(yè)伙伴與開發(fā)者構建可持續(xù)發(fā)展的AI基礎設施,為產業(yè)智能化提供源源不絕的動力。
大模型不是終點,而是起點
隨著“百模大戰(zhàn)”的興起,大模型以最高效率抵達了產業(yè)繁榮狀態(tài)。但隨之到來的是很多疑慮,比如在有了大模型之后,我們究竟如何讓它發(fā)揮價值?比如,大模型的技術能力,還能不能進一步突破,如何突破?再比如大模型之間的競爭,會不會變成低價、低質的競底游戲?
這些疑慮背后的關鍵,是產業(yè)界目前傳遞出的信號,過分強調“要有大模型”。反而很少提及大模型如何長期發(fā)展,如何擺脫零和博弈。
我們關注大模型,難道不是驚艷于它的表現(xiàn),于是開始暢想它的未來嗎?難道我們真的滿足于“有很多大模型”就是終局嗎?
換言之,大模型應該是起點,而非終點。
目前來看,大模型的技術、產業(yè)與生態(tài)都還處在發(fā)展的萌芽期。各方應該攜手共建,描畫大模型的美好未來。大模型之路,至少需要完成三個目標:
1.向產業(yè)價值,完成大模型向C端與B端的應用落地,推動AI原生應用走向時代前沿。
2.向眾智生態(tài),大模型應該是各行各業(yè)、萬千開發(fā)者的大模型,集眾智才能立高遠。
3.向技術突破,大模型目前的表現(xiàn)僅是開端,我們需要有方法、有路徑來驅動大模型持續(xù)發(fā)生技術突破,直到走向AGI的遠景目標。
如何鋪這條大模型路?百度在WAVE SUMMIT深度學習開發(fā)者大會2023,展示了他們一直以來都在做的三件事。
指南針:AGI曙光已現(xiàn)
如果說,大模型還能向前走,那么它應該向哪里走?百度為大模型時代鋪路,做的第一件事,是向各界展示了關于大語言模型方向的“指南針”。
AI開發(fā)者們都知道,WAVE SUMMIT深度學習開發(fā)者大會,歷來是呈現(xiàn)百度對深度學習技術未來洞察的舞臺。
2019年,王海峰在首屆WAVE SUMMIT中提出,深度學習具有很強的通用性,并具備標準化、自動化和模塊化的工業(yè)大生產特征,推動人工智能進入工業(yè)大生產階段。
四年來,AI工業(yè)大生產的方向不斷得到了充分驗證,更引導了AI產業(yè)的發(fā)展與AI開放生態(tài)的繁榮。今天,AI技術在各領域展現(xiàn)出了充沛的生產力釋放效應,證明AI工業(yè)大生產階段已經(jīng)正式到來。
面對大模型時代新的方向性問題,王海峰也給出了清晰明確的洞察。本屆WAVE SUMMIT,王海峰首次對外表示,人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的核心基礎能力,這四項能力越強,越接近通用人工智能,而大語言模型具備了這四項能力,為通用人工智能(AGI)帶來曙光。
也就是說,大模型持續(xù)向前發(fā)展,實現(xiàn)技術突破是可預見、可期待、可實現(xiàn)的。以理解、生成、邏輯、記憶四項核心技術作為向量,我們可以規(guī)劃出大模型長期發(fā)展的路標與路徑。
這樣的論斷,建立于百度扎實的技術探索之上。
以文心一言為例,它首先從數(shù)萬億數(shù)據(jù)和數(shù)千億知識中融合學習得到預訓練大模型,在此基礎上采用有監(jiān)督精調、人類反饋的強化學習和提示等技術,并具備知識增強、檢索增強和對話增強等技術優(yōu)勢。進一步地,文心一言通過多種策略優(yōu)化數(shù)據(jù)源及數(shù)據(jù)分布、基礎模型長文建模、多類型多階段有監(jiān)督精調、多任務自適應有監(jiān)督精調、多層次多粒度獎勵模型等技術創(chuàng)新,全面提升基礎通用能力。在檢索增強和知識增強的基礎上,通過知識點增強,提升對世界知識的掌握和運用;通過大規(guī)模邏輯數(shù)據(jù)構建、邏輯知識建模、多粒度語義知識組合以及符號神經(jīng)網(wǎng)絡,提升邏輯能力;通過構建數(shù)據(jù)、內容、模型和系統(tǒng)安全的全面安全體系,保障大模型的安全性。可以說,其具備了理解、生成、邏輯、記憶等核心基礎能力。
王海峰的闡釋既解答了各界對大模型長期發(fā)展動力的期待,更直接點明了AGI這一長期目標的實現(xiàn)方式。將目前的大模型技術基礎,與人類科技的星辰大海聯(lián)接在了一起。
除此之外,王海峰還分享了百度在大模型效率、應用等方面的最新進展。
所有遠大航程都始于找到正確的航海圖。大語言模型具備了理解、生成、邏輯、記憶四項核心基礎能力,帶來AGI的曙光,正是這樣一張值得各界深度思考的航圖。
筑路基:文心加飛槳的步步向前
知道了要向哪里走,接下來的問題是應該如何走?面對這個問題,百度為大模型時代做的第二件事,就是通過文心加飛槳,為大模型發(fā)展鋪設新的路基。
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示,文心一言熟練掌握的創(chuàng)作體裁超過 200 種,涵蓋了幾乎所有寫作需求,內容豐富度是初期的 1.6 倍、思維鏈長度是初期的 2.1 倍,知識點覆蓋是初期的 8.3 倍。
這樣的進展效率背后,是百度在核心技術、開發(fā)平臺、應用部署等領域協(xié)同發(fā)力的成果。而百度在大模型領域得到的先驅者經(jīng)驗,也將通過文心加飛槳打造的AI基礎設施,面向開發(fā)者與千行百業(yè)進行落地。
在本屆WAVE SUMMIT當中,我們可以看到百度圍繞大模型的開發(fā)、優(yōu)化、應用,取得了許多關鍵性、基礎性的進展,我們可以從中試舉幾項加以說明:
1.擴展大模型能力邊界的插件生態(tài)
面對全新的大模型機遇,插件機制是開發(fā)者急切期待的。為了填補這一需求,文心大模型在 3.5 版本中新增了插件機制,已上線了百度搜索、覽卷文檔、一鏡流影、說圖解畫、E言易圖五種官方原生插件。王海峰表示,未來百度將與開發(fā)者共建插件生態(tài),共享技術創(chuàng)新成果。
從WAVE SUMMIT的反饋來看,各界對這些插件的認可達到了很高指數(shù)。
比如說,覽卷文檔可以借助文檔智能模型及搜索系統(tǒng),實現(xiàn)對文檔的格式、布局等信息充分理解及定位,從而幫助用戶實現(xiàn)文檔摘要、問答及創(chuàng)作的需求。
再比如,一鏡流影依托文心跨模態(tài)大模型,突破了不同模態(tài)之間語義對齊等技術難題。用戶僅需簡單輸入文字,即可在1分鐘內獲得高質量的AIGC視頻,為大模型+視頻帶來了全新的效率升級與想象力突破。
E言易圖則實現(xiàn)了將文字需求轉化為可視化圖表的需求。僅需簡單的數(shù)據(jù)圖表需求,或輸入待生成圖表的數(shù)據(jù)內容,即可生成可交互圖表,協(xié)助用戶完成數(shù)據(jù)分析、洞察及圖表信息的交互演示,從而實現(xiàn)大模型與辦公、財務、數(shù)據(jù)統(tǒng)計等領域更為緊密、有針對性的結合。
2.深度學習平臺與大模型的聯(lián)合優(yōu)化
在大模型成為各界關注重點之后,如何更好更快地訓練大模型,提升大模型推理效率,成為了產業(yè)中至關重要的挑戰(zhàn)。為此,經(jīng)過緊密的技術升級,百度已經(jīng)將文心與飛槳聯(lián)合優(yōu)化這條路跑通、跑順,成為了整個大模型產業(yè)可以參考的升級范本。
本屆 WAVE SUMMIT 上正式發(fā)布了飛槳開源框架v2.5,其全面完成了架構升級,同時在大模型訓練、推理和多硬件適配方面帶來了新的功能。其中,文心與飛槳聯(lián)合優(yōu)化最為關鍵,通過協(xié)同優(yōu)化,文心大模型 3.5 訓練速度是優(yōu)化前的3 倍,推理速度更是達到了30倍以上。
大模型效率的提升離不開飛槳的加持,在訓練方面,百度總結了一套打法:
從硬件資源層面看,飛槳與文心在硬件集群上進行協(xié)同優(yōu)化,提升了有效訓練時間占比;通過芯片、存儲、網(wǎng)絡協(xié)同優(yōu)化,提升了模型的訓練吞吐速度,從而全面實現(xiàn)了以更小資源消耗實現(xiàn)大模型訓練目標;與模型算法協(xié)同優(yōu)化,提高收斂效率。在大模型訓練中,優(yōu)化收斂效率和穩(wěn)定性,可大幅度減少訓練時間,達到事半功倍的效果。
在推理方面,飛槳則是從模型壓縮、推理引擎、服務部署三個關鍵環(huán)節(jié)進行協(xié)同優(yōu)化。作為深度學習開發(fā)平臺,飛槳可以支持AI模型從訓練到推理的全流程落地。舉例來看,飛槳模型推理服務就可以有效支持大模型推理效率提升。其在業(yè)內首創(chuàng)了支持動態(tài)插入的分布式推理引擎,從而可以更有效完成龐大數(shù)據(jù)規(guī)模的AI模型進行推理部署。在這些關鍵環(huán)節(jié)的協(xié)同推理能力提升下,飛槳不斷幫助文心大模型提升推理效率與推理性能,讓模型的學習效果與魯棒性更強,從而取得更強的應用效果。
到目前為止,文心與飛槳的聯(lián)合優(yōu)化路徑被持續(xù)驗證,進而打通了大模型低成本、高效率落地的大門。
3.應用側的先導示范。
面對著大模型的能力與機遇,各界不僅關注大模型基礎技術,同時也希望在應用側直接獲得大模型支持,以及通過有效的AI原生應用來探索自身的應用落地方案。
在這一方面,WAVE SUMMIT 上展示了文心一言的能力,通過智能工作平臺如流進入辦公場景,全面提升辦公效率。百度集團副總裁、百度集團首席信息官李瑩發(fā)布了如流的“超級助理”。 在代碼智能化場景,百度Comate系列產品全新升級,重磅發(fā)布智能編程助手ComateX和Comate Stack工具套件,實現(xiàn)了代碼解釋、代碼生成、行間注釋生成、單元測試用例等能力。
文心加飛槳,通過不斷升級技術、完善工具、落地應用,讓大模型的路基沿著正確方向一路鋪設開去,從而讓更多開發(fā)者、更多行業(yè)伙伴能夠走上這條路,走近大模型的時代機遇。只有在眾力眾行之下,中國AI才能滾滾向前。
開航道:為開發(fā)者,為產業(yè),為生態(tài)
在定準方向,夯實技術之后,下一個問題是如何讓更多人加入進來,分享大模型紅利。為此,百度為大模型時代做的第三件事,是把大模型變成繁榮的生態(tài)航道。讓更多行業(yè)、更多開發(fā)者以高效率、低門檻的方式融入進來,駛向自己的目標。
生態(tài)與技術并重,始終是百度發(fā)展AI技術的立足根本。經(jīng)過多年發(fā)展,產業(yè)級深度學習開源開放平臺飛槳,已經(jīng)凝聚了800萬開發(fā)者,服務于22萬家企事業(yè)單位,基于飛槳創(chuàng)建的AI模型達到80萬個。
而面向大模型的機遇,百度同樣也廣開生態(tài)之門,注重社區(qū)發(fā)展。WAVE SUMMIT 期間,王海峰發(fā)布了飛槳開發(fā)者社區(qū)AI Studio中文名“星河社區(qū)”,寓意“文心加飛槳,翩然赴星河”。
與此同時,正式推出了星河大模型社區(qū)。在社區(qū),開發(fā)者可以獲得一體化的大模型開發(fā)支持。飛槳+文心貫通全開發(fā)流程,與開發(fā)者持續(xù)共創(chuàng)大模型項目和應用。目前,星河大模型社區(qū)已上線了超過 300 個大模型創(chuàng)意應用,還提供了豐富的功能方便開發(fā)者進行交流。百度還發(fā)布了文心大模型“星河”共創(chuàng)計劃,提供生態(tài)和產業(yè)資源,與廣大開發(fā)者共同推動人工智能應用創(chuàng)新。
而在作為AI產業(yè)底座的硬件領域,文心大模型最新與英偉達、寒武紀、華為等12家硬件伙伴開展了適配,覆蓋了云和端側多種硬件類型。目前,已經(jīng)有25家硬件伙伴參與到了星河社區(qū)硬件生態(tài)專區(qū)的共建當中。
從產業(yè)落地的角度來看,文心大模型的落地規(guī)模在國內保持領先,已經(jīng)有15 萬家企業(yè)申請了文心一言內測,其中超過 300 家生態(tài)伙伴在 400 多個具體場景取得了測試成效,覆蓋辦公提效、知識管理、智能客服、智能營銷等領域。同時,百度聯(lián)合國家電網(wǎng)、浦發(fā)銀行、泰康、吉利等企業(yè)聯(lián)合發(fā)布了 11 個行業(yè)大模型。
不難看出,百度開辟的大模型航道,已經(jīng)實現(xiàn)了落地廣泛、生態(tài)繁榮、伙伴眾多。百度的大模型之路,正在這樣的航道上徐徐展開。
相比于以“有大模型”作為全部目標,百度的大模型之路目光更遠,看向AGI的星辰大海。
相比于堆積參數(shù)和技術務虛,百度的大模型之路更加腳踏實地,它是在一個個插件,一次次優(yōu)化中走通的,每一個腳印清晰可見。
相比于短期利益與劣幣競爭,百度的大模型之路堅持生態(tài)互利,它是行業(yè)的路,開發(fā)者的路,更多人的路。
中國AI的大模型之路,當如是也。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。