隨著時間來到2023年第三季度,國產(chǎn)大模型已經(jīng)達到100多個,“百模大戰(zhàn)”正式開啟。
大模型,我們有了很多選擇,也開始呈現(xiàn)出某種同質(zhì)化。除了拼參數(shù)、比背景、看榜單,有沒有其他方法,讓我們更好地判斷一個大模型的價值呢?
亞里士多德認為,任何一個系統(tǒng)都有自己的第一性原理,它是一個根基性命題或假設(shè),不能缺省,也不能被違背。
透過表象,追尋本質(zhì),會發(fā)現(xiàn)各家大模型的 “第一性原理”,有很大的不同。而這個核心的不同,也會帶動大模型走向不同的發(fā)展模式。
比如OpenAI的內(nèi)核是AGI,大語言模型以“通用人工智能”的目標(biāo),作為出發(fā)點,最近才開始走向行業(yè)。
一些通用大模型,內(nèi)核是“科研”,在榜單上有不俗的成績,而行業(yè)應(yīng)用所需要的配套工具、算力基礎(chǔ)設(shè)施等,則不在研發(fā)者的考量中,逐漸淡出主流視野。
一些產(chǎn)業(yè)大模型,內(nèi)核是“應(yīng)用”,要快速勝任某一些具體的任務(wù)場景,加入了行業(yè)知識和專有數(shù)據(jù)“特訓(xùn)”,可基礎(chǔ)模型能力一般,遇到“常識性問題”就掉鏈子。
工具可以開發(fā),算力可以買,一個大模型的內(nèi)在價值核心,卻不會輕易替換。
我們一層層剝開京東大模型,看到了一個核心,就是——“產(chǎn)業(yè)”。
最近恰逢WAIC和JDD大會,我們跟京東探索研究院院長、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬博士,進行了多次交流,他深入分享了很多京東對于大模型的思考。
將“產(chǎn)業(yè)價值”作為大模型的“第一性原理”,會讓大模型走出怎樣一條差異化的發(fā)展之路呢?我們不妨以京東為例,來展望一下產(chǎn)業(yè)大模型的未來。
大模型的價值起點
巴菲特曾說過,投資是滾雪球,找到“長長的坡”和“很濕的雪”,雪球一旦啟動,堅持下去,就能越滾越大。
從產(chǎn)業(yè)的視角出發(fā),會發(fā)現(xiàn)大模型這顆“雪球”的核心價值自證,確實還存在著很多問題,比如:
1.技術(shù)的可用性存疑。
產(chǎn)業(yè)化最后一公里的問題,看起來好像不大,卻是決定大模型能用不能用的邊界。
京東從2017年開始關(guān)注大模型,就很注重行業(yè)落地,也碰到了一些經(jīng)驗教訓(xùn)。
何博士直言,“拿著刷榜的技術(shù)給業(yè)務(wù)部門去秀,用起來碰到各種各樣的小問題,對使用者來說不可用,后來人家就不信你了,你再怎么說也覺得你技術(shù)不行”。
2.行業(yè)的連接不夠充沛。
大模型落地,需要解決一個一個具體問題。這些問題不可能在實驗室里“涌現(xiàn)”,行業(yè)到底需求什么,有哪些限制條件,都要從產(chǎn)業(yè)實踐和應(yīng)用中找到答案。
何曉冬博士認為,大模型是不能自己坐在辦公室拍腦袋想出來的,一定是行業(yè)凝練出來的。
但向上觸碰學(xué)術(shù)、向下扎根行業(yè),這樣的AI研究機構(gòu)本身就很稀缺。
3.價值回報還很朦朧。
引入大模型,意味著企業(yè)要增加各種成本,消耗大量的資源。企業(yè)引入大模型,也希望得到經(jīng)過反復(fù)嘗試被證明沒有問題的產(chǎn)品。目前很多大模型的價值自證,還不夠有力。
何博士就提到,一般的生成式語言模型,內(nèi)容正確率是83%、85%左右,to C用戶覺得還可以,但嚴(yán)肅商用的時候,模型正確率要達到95%以上,才能達到企業(yè)的要求。“明明這個活動打的是八折,大模型生成的營銷文案說是五折,這個事情商業(yè)上是不可接受的”。
事非躬行不知難,大模型急需一場產(chǎn)業(yè)價值的自證與他證。
破解方式其實也很簡單,就是一步一個腳印,把該踩的坑都踩了,把遇到的問題都一一解決。
所以年初,大語言模型高歌猛進的時候,京東沒有跟風(fēng),它在忙什么?忙著解決問題。
京東的長坡
以“產(chǎn)業(yè)價值”作為 “第一性原理”,京東做大模型最先關(guān)注的,不是簽了多少單,什么時候開發(fā)布會,而是夯實基礎(chǔ)設(shè)施。
AI三要素:數(shù)據(jù)、算力、算法,都需要升級,才能撐住大模型時代,如同一個“長坡”,讓大模型的“價值雪球”可以向前滾動。
先說數(shù)據(jù)。產(chǎn)業(yè)大模型,一般是先用公域數(shù)據(jù)訓(xùn)練基礎(chǔ)模型,再用行業(yè)專有數(shù)據(jù)進行“特訓(xùn)”,相當(dāng)于先在中學(xué)上通識課,再到大學(xué)里去學(xué)專業(yè)技能。京東的思路很不一樣,言犀大模型訓(xùn)練時融合70%的通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù),把零售、金融、健康、物流的know-how和數(shù)據(jù),也放到基座模型中,相當(dāng)于既做了通識教育,又上了很多門專業(yè)課,有更多的行業(yè)理解。
所以京東的大模型一推出來,面向知識密集型、任務(wù)型產(chǎn)業(yè)場景,已經(jīng)可以解決真實產(chǎn)業(yè)問題。
再說算法。算法是大模型的核心能力,也是拉開產(chǎn)品體驗差距的關(guān)鍵。目前,單點算法已經(jīng)不足以撐起大模型了,大語言模型就包含了強化學(xué)習(xí)、提示學(xué)習(xí)、預(yù)訓(xùn)練等一系列優(yōu)化。成體系的技術(shù)體系和算法創(chuàng)新,也更容易形成護城河。
然后是算力。很多大模型推出后不久便停止開放、限制互動次數(shù),就是因為算力不足或成本昂貴,企業(yè)想用也用不起。所以,大模型后續(xù)能否持續(xù)為產(chǎn)業(yè)所用,算力不能成為短板。
京東在2021年就建立了最先進的DGX集群,在重慶落地了全國首個基于SuperPOD架構(gòu)的超大規(guī)模計算集群——天琴α,推理提速6.2倍,推理成本節(jié)省90%,為基礎(chǔ)大模型的訓(xùn)練和迭代提供保障,保持競爭力。
一路深耕AI三要素,京東為大模型從技術(shù)走向產(chǎn)業(yè),構(gòu)筑了一條“長坡”。至此,大模型的價值底座,已經(jīng)非常堅實。
產(chǎn)業(yè)的厚雪
回顧上一階段的產(chǎn)業(yè)智能化,很多技術(shù)能力都停留在表面,難以深入行業(yè)或規(guī)模化復(fù)制。大模型的價值變得飽滿,要卷起產(chǎn)業(yè)的“厚雪”,將雪球越滾越大。
在何曉冬博士分享的一系列京東大模型技術(shù)和實踐里,我們可以看到,大模型黏住產(chǎn)業(yè)“厚雪”的多種姿勢:
一是技術(shù)黏著。
產(chǎn)業(yè)AI落地難的很多問題,其實都源于技術(shù)瓶頸,比如深度學(xué)習(xí)的不可解釋性、泛化能力不足、模型精度不夠等。京東通過基礎(chǔ)技術(shù)的體系化突破,讓大模型變得高可用,形成端到端的產(chǎn)品價值。
比如數(shù)字人,基于10余年智能對話經(jīng)驗與多模態(tài)交互技術(shù)積淀,京東云多模態(tài)數(shù)字人只需要極少量樣本素材,5分鐘簡易拍攝,就可以自動生成聲情并茂的數(shù)字人,讓中小商家與個人能夠用得起、用得上數(shù)字人服務(wù),算力、開發(fā)周期、人才等高門檻不再成為問題。
二是工具黏著。
目前,很多大模型廠商都開放了API調(diào)用的MaaS服務(wù),但一個容易忽略的問題是,調(diào)API也是需要一定能力和開發(fā)工作的,很多傳統(tǒng)行業(yè)的用戶,連AI基礎(chǔ)調(diào)用API的能力都不一定有。
豐富、極簡、開箱即用的工具,是產(chǎn)業(yè)落地必不可少的條件。京東的目標(biāo)是,讓對AI完全沒有認知的用戶,也可以直接使用大模型,提供從數(shù)據(jù)模型到應(yīng)用服務(wù)的全周期管理,從基礎(chǔ)層、模型層、MaaS,延伸到了應(yīng)用層的SaaS服務(wù)。
言犀大模型開放計算平臺的行業(yè)知識庫,就沉淀了100多種訓(xùn)練和推理優(yōu)化工具,不到一周時間,即可完成從數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、到模型部署的全流程。
三是實踐黏著。
比起某個榜單上的書面效果,企業(yè)應(yīng)用大模型,更希望看到實際應(yīng)用中的真實效果,對技術(shù)能力和價值收益有一個更清晰的感知。京東已經(jīng)進行了大量的產(chǎn)業(yè)實踐,優(yōu)勢格外明顯。
目前,大模型在零售、金融、健康、物流等京東內(nèi)部高復(fù)雜場景大規(guī)模錘煉,并融合行業(yè)解決方案對外輸出,可以減少大模型落地的顧慮和成本。
比如文本生成,零售領(lǐng)域的文案,每個品類的敏感信息審核門檻都不一樣,基于京東全品類豐富的商品數(shù)據(jù)積累和大模型,京東云AIGC內(nèi)容營銷平臺,已經(jīng)可以通過一張商品圖片,生成電商運營需要的商品主圖,營銷海報圖和商詳圖等,每套圖成本降低90%,周期從7天縮短到半天,而且不用擔(dān)心內(nèi)容有風(fēng)險,因為大模型的安全可信,在京東零售內(nèi)部已經(jīng)錘煉過了。
再比如健康診療,是一個對內(nèi)容專業(yè)性和可靠性要求非常高的場景,京東健康應(yīng)用大模型,進行健康助手及輔助診療,已涵蓋超千種疾病專業(yè)性服務(wù),目前累計超3千萬高質(zhì)量醫(yī)患對話,百萬級規(guī)模醫(yī)學(xué)知識圖譜。這些積累。
黏住產(chǎn)業(yè)的“厚雪”,做實大模型的技術(shù)紅利,是這一輪AI熱潮,帶給科技企業(yè)的真正機遇。
在京東,產(chǎn)業(yè)大模型已經(jīng)從一種技術(shù)設(shè)想,逐漸變?yōu)榍逦陌l(fā)展方向,以及可執(zhí)行的行動方案,正在撬動產(chǎn)業(yè)AI的下一個可能。
抱一而為天下式,大模型的價值探索
在年初的熱鬧中保持冷靜,在“百模大戰(zhàn)”來臨之際,京東卻率先給出了大模型的價值公式:大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方。
當(dāng)下階段,大模型的野蠻生長,已經(jīng)告一段落,走向新的應(yīng)用紀(jì)元。推動大模型“從參數(shù)為中心”向“以應(yīng)用為中心”轉(zhuǎn)變,是目前的核心問題。京東憑什么后發(fā)先至?或許是很多讀者心中的“未解之謎”。
但透過 “第一性原理”,我們卻可以看到,京東大模型差異化,是一種“必然”。
京東技術(shù)的“第一性原理”,就是“產(chǎn)業(yè)價值”。
如京東CEO許冉所說,京東研發(fā)每一項技術(shù),都將產(chǎn)業(yè)屬性作為出發(fā)點、產(chǎn)業(yè)價值作為目標(biāo):技術(shù)源于產(chǎn)業(yè)需求,歷練于產(chǎn)業(yè)場景,創(chuàng)造產(chǎn)業(yè)價值。
這個“第一性原理”,造就了京東大模型的路線分野——產(chǎn)學(xué)研用的高度結(jié)合。
不同的出發(fā)點:不同于科研類大模型的“兩耳不聞窗外事”,也不同于行業(yè)大模型的“一心只掃門前雪”,京東從產(chǎn)業(yè)端切入大模型,既需要錘煉基座模型的先進技術(shù),又需要考慮為整個產(chǎn)業(yè)和社會創(chuàng)造價值,這條路如同“從北坡等珠峰”,更難也更有價值。
不同的行路人:看到了路,就需要有攀登的人。以何曉冬博士為代表的京東技術(shù)人,眼中有人間煙火,聚焦產(chǎn)業(yè)場景,服務(wù)京東自己的業(yè)務(wù)需要,技術(shù)在真實場景中被實踐打磨,被驗證,再解耦賦能其他合作伙伴;眼中也有星辰大海,京東探索研究院當(dāng)技術(shù)剛剛在地平線上露出來的時候,就看到五年后可能會發(fā)生一些革命性的改變,開始前瞻性的布局,大模型就是其中之一,具身智能、多模態(tài)大模型、AGI等,都是京東正在關(guān)注的方向。
不同的路線圖:京東做大模型,不是“無的放矢”,對于大模型的應(yīng)用實踐,已經(jīng)有了明確的“三步走”規(guī)劃,第一步,基于內(nèi)部實踐構(gòu)建通用大模型;第二步,在零售、金融、健康、物流等京東內(nèi)部高復(fù)雜場景大規(guī)模錘煉,融合行業(yè)解決方案對外輸出;第三步,針對嚴(yán)肅商業(yè)場景將大模型能力對外開放。目前,京東云已經(jīng)基于內(nèi)部實踐構(gòu)建了通用大模型。到今年年底,京東將經(jīng)由高復(fù)雜場景大規(guī)模錘煉,迭代出扎實的產(chǎn)業(yè)服務(wù),預(yù)計在2024年初,會將大模型能力向外部嚴(yán)肅商業(yè)場景開放。目前,京東已經(jīng)走到第二步,并在內(nèi)部取得了豐富的實踐成果。
以“產(chǎn)業(yè)價值”作為大模型的“第一性原理”,驅(qū)動著京東在大模型領(lǐng)域,走上了差異化的發(fā)展模式,率先完成了產(chǎn)業(yè)價值的創(chuàng)生和積累,更早進入應(yīng)用紀(jì)元。
京東大模型的“價值雪球”,正以“馬太效應(yīng)”越滾越大,加速駛向千行百業(yè)、人間煙火。抱一而為天下式,大模型的產(chǎn)業(yè)價值,最終會凝結(jié)在萬千眾生的微笑里。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。