原標(biāo)題:大模型的禾下乘涼夢,百度自己來做試驗田
禾下乘涼夢,是一個今天國人無比熟悉的詞。它來自袁隆平院士對雜交水稻高產(chǎn)的理想追求,是袁隆平的中國夢。他生前多次提到,夢想到禾下乘涼,夢里水稻長得有高粱那么高,籽粒有花生米那么大。
或許,千行百業(yè)都有這樣一個“禾下乘涼夢”??萍继剿鲿樯a(chǎn)與創(chuàng)造帶來難以估量的價值,極大改變?nèi)藗兊纳?。?a href="http://worldfootballweekly.com/AI_1.html" target="_blank" class="keylink">AI領(lǐng)域,有一項技術(shù)經(jīng)常讓我聯(lián)想到“禾下乘涼夢”,那就是預(yù)訓(xùn)練大模型。在袁隆平院士的夢中,雜交水稻會長得非常高大,帶來極高的畝產(chǎn)量;大模型也是在訓(xùn)練數(shù)據(jù)與模型規(guī)模上非常大,在模型能力上形成巨大優(yōu)勢。
從2018年開始,大模型開始作為AI領(lǐng)域重要的技術(shù)方向被廣泛關(guān)注。多年過去,我們對于大模型最大的期待,或許就在于它能不能從實驗室和數(shù)據(jù)集中的“種子”,真正變成一片片賦能行業(yè),普惠經(jīng)濟的稻田。
雜交水稻的發(fā)展,離不開精心耕耘的試驗田。實現(xiàn)大模型的“禾下乘涼夢”,或許也需要這樣的“試驗田”挺身而出,為時代探明大模型的前進(jìn)方向——這個關(guān)頭,百度站了出來。
9月23日,2022萬象·百度移動生態(tài)大會在廣東珠海召開。會上,百度集團資深副總裁、百度移動生態(tài)事業(yè)群組(MEG)總經(jīng)理何俊杰首次對外全面解讀百度移動生態(tài)戰(zhàn)略。其中非常值得注意的一點,是會上詳細(xì)展示了我們熟悉的百度移動生態(tài),是如何與百度打造的文心系列大模型深度結(jié)合,帶來搜索、信息流、AIGC等領(lǐng)域的禾木生長。在百度移動生態(tài)中,文心大模型的能力可謂能用盡用,應(yīng)出盡出。
換個角度想,如果我們想知道未來千行百業(yè)如何在大模型的禾下乘涼,那么今天百度移動生態(tài)的場景坐標(biāo),或許正指向著明天智能中國的大模型之路。
大模型3.0階段,產(chǎn)業(yè)轉(zhuǎn)化成為核心
在討論百度移動生態(tài)融合文心大模型能力的重要性之前,我們必須先來了解這背后的技術(shù)與產(chǎn)業(yè)背景。百度移動生態(tài)與大模型融合之所以重要,是因為大模型這項技術(shù)本身正處在非常重要的發(fā)展節(jié)點。
從發(fā)展歷程上看,從2018年預(yù)訓(xùn)練大模型開始受到行業(yè)重視算起,大模型的發(fā)展可以歸納為三個階段。第一階段就是所謂的“大煉模型”。傳統(tǒng)的深度模型已經(jīng)是行業(yè)主旋律,而預(yù)訓(xùn)練大模型作為一種新興的技術(shù)思路,開始進(jìn)入萌芽階段。接下來在第二階段,大模型的價值得到了產(chǎn)學(xué)各界的普遍認(rèn)同。伴隨著資本與社會關(guān)注度的廣泛注入,談AI必談大模型成為風(fēng)尚,各界也就進(jìn)入從“大煉模型”到“煉大模型”的轉(zhuǎn)變。在這個階段中,各種大模型層出不窮,在訓(xùn)練數(shù)據(jù)參數(shù)上的擴張,技術(shù)思路的發(fā)展帶來了大模型技術(shù)的繁榮。
當(dāng)大模型的技術(shù)研發(fā)儲備到一定階段,新的挑戰(zhàn)也隨之而來:這么多大模型,到底應(yīng)該如何與產(chǎn)業(yè)應(yīng)用結(jié)合?這個問題如果不能妥善解決,那么大模型的繁榮發(fā)展終究是空中樓閣。所以,大模型的3.0階段,就是從“煉大模型”到“用大模型”的轉(zhuǎn)變。如何實現(xiàn)有效的產(chǎn)業(yè)轉(zhuǎn)化,已經(jīng)變成了目前階段大模型領(lǐng)域的最核心任務(wù)。
想要用好大模型,從技術(shù)向產(chǎn)業(yè)的轉(zhuǎn)化邏輯上看,需要具備三個前提條件:技術(shù)過硬,平臺與工具齊備,有清晰明確的場景價值作為示范。而一路深耕文心系列大模型的百度,顯然在前兩項能力中具備先發(fā)優(yōu)勢。
百度自2019年開始深耕預(yù)訓(xùn)練模型研發(fā),發(fā)布了知識增強文心ERNIE系列模型。2021年12月,百度與鵬城實驗室聯(lián)合發(fā)布全球首個知識增強千億大模型“鵬城-百度·文心”,參數(shù)規(guī)模達(dá)到2600億,在60多項NLP任務(wù)中取得最好效果。2022年5月的Wave Summit深度學(xué)習(xí)開發(fā)者峰會上,百度發(fā)布10個大模型,包括融合學(xué)習(xí)任務(wù)知識的知識增強千億大模型、多任務(wù)統(tǒng)一學(xué)習(xí)的視覺大模型、跨模態(tài)大模型、生物計算大模型、行業(yè)大模型等,并提出支撐大模型產(chǎn)業(yè)落地的3個關(guān)鍵路徑:建設(shè)更適配場景需求的大模型體系,提供全流程支持應(yīng)用落地的工具、平臺和方法,建設(shè)激發(fā)創(chuàng)新的開放生態(tài)等。
至此,文心大模型已經(jīng)既包含基礎(chǔ)的通用大模型,也包含面向重點任務(wù)領(lǐng)域的行業(yè)大模型,同時還具備豐富的工具平臺。從技術(shù)過硬角度看,文心大模型具有知識增強的差異化優(yōu)勢,可以從大規(guī)模知識圖譜和海量無結(jié)構(gòu)數(shù)據(jù)中完成學(xué)習(xí),從而實現(xiàn)模型效率更高、效果更好,具有良好的可解釋性。從平臺建設(shè)與產(chǎn)業(yè)轉(zhuǎn)化上看,文心大模型具有產(chǎn)業(yè)級特性,提供全流程支持應(yīng)用落地的工具和方法,營造激發(fā)創(chuàng)新的開放生態(tài)。
換言之,清晰的場景化示范價值,是文心大模型推動大模型走向3.0階段的“最后一公里”。這個時候,百度豐富的產(chǎn)業(yè)生態(tài)布局,就體現(xiàn)出了關(guān)鍵價值。
百度移動生態(tài),做大模型時代的“試驗田”
在科技領(lǐng)域有句話,叫“自己的降落傘自己先跳”。對于希望率先探索大模型應(yīng)用與產(chǎn)業(yè)轉(zhuǎn)化的百度來說,也必須“自己的大模型自己先用”。
好在百度豐富的移動生態(tài)布局,不僅是大模型應(yīng)用的價值沃土,更能以其苛刻的技術(shù)要求、清晰的能力展現(xiàn)、具有代表性的應(yīng)用場景,成為更多開發(fā)者與企業(yè)的大模型“試驗田”。
2022萬象·百度移動生態(tài)大會中,我們看到了百度移動生態(tài)與文心大模型基礎(chǔ)能力豐富多元的融合。百度移動生態(tài),向來是百度AI技術(shù)落地的“首站”,長期秉持著AI技術(shù)能用盡用、能出盡出的原則。
而在與大模型的結(jié)合上,我們首先可以看到百度最新發(fā)布了面向搜索場景的跨模態(tài)大模型“知一”。它可以理解全網(wǎng)文本、圖片、視頻、結(jié)構(gòu)化信息等形態(tài)各異的資源,從而打破資源形態(tài)的界限,將最滿足用戶需求的結(jié)果呈現(xiàn)給用戶,真正實現(xiàn)大模型技術(shù)與搜索、信息流等百度核心業(yè)務(wù)的深度融合。
而對于更多百度移動生態(tài)中的開發(fā)者、創(chuàng)作者而言,基于文心大模型打造的“創(chuàng)作者AI助理團”可以帶來劃時代的AIGC體驗。這個AI團隊里,有文案、有插畫師、有視頻制作人,在這些“助理”們的齊心努力下,可以讓創(chuàng)作者實現(xiàn)“一個人成為一支隊伍”。
基于百度文心大模型,“AI文案助理”可以根據(jù)創(chuàng)作者的需求快速產(chǎn)出不同風(fēng)格的文章標(biāo)題、內(nèi)容段落,“AI插畫助理”可以根據(jù)關(guān)鍵詞,自動“畫”出十余種不同風(fēng)格的畫作,讓創(chuàng)作者實現(xiàn)“配圖自由”。相關(guān)能力,目前已經(jīng)可以在百度APP中體驗,效果十分突出。
“AI視頻制作助理”基于文心大模型的自然語言處理和跨模態(tài)AI技術(shù),讓創(chuàng)作者的圖文自動生成視頻,速度可達(dá)“分鐘級”。這項技術(shù)讓創(chuàng)作者從圖文到視頻的創(chuàng)作周期縮短了3倍以上,而且也為創(chuàng)作者帶來“一篇內(nèi)容,兩種收益”的效果。
“創(chuàng)作者AI助理團”,可說是全景式展現(xiàn)了大模型的一個應(yīng)用價值——AIGC(AI Generated Content,人工智能自動生成內(nèi)容)?;诖竽P痛蛟斓腁IGC能力,可以實現(xiàn)多種多樣的AI自主創(chuàng)作,以及形態(tài)豐富的創(chuàng)作輔助功能,實現(xiàn)自動生產(chǎn)文案、自動生產(chǎn)圖片、圖文轉(zhuǎn)視頻等一系列技術(shù)飛躍。目前,“創(chuàng)作者AI助理團”已經(jīng)開始邀請內(nèi)測,將從今年第四季度起陸續(xù)向更多創(chuàng)作者開放。
由此我們不難看出,文心大模型帶給百度移動生態(tài)的能力并不是“錦上添花”的簡單能力升級,而是實打?qū)嵉目缭绞絼?chuàng)新,甚至可以說解決了移動開發(fā)者、創(chuàng)作者長期以來最核心的創(chuàng)作門檻困擾,讓創(chuàng)作者聚焦于創(chuàng)作的最核心部分。
這樣的能力升級,當(dāng)然對于百度移動生態(tài)的未來發(fā)展至關(guān)重要。但更重要的,可能是這種結(jié)合展示了一種可能,一種大模型走向深度產(chǎn)業(yè)應(yīng)用的可能。
AIGC豐收時,行業(yè)轉(zhuǎn)化深耕中:文心大模型的禾下乘涼夢
不久之前,科技部發(fā)布了《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場景的通知》(以下簡稱《通知》),指出要充分發(fā)揮人工智能賦能經(jīng)濟社會發(fā)展的作用,打造形成一批可復(fù)制、可推廣的標(biāo)桿型示范應(yīng)用場景。
不難看出,以場景作為先導(dǎo),快速實現(xiàn)AI技術(shù)的行業(yè)落地與規(guī)?;o助正在成為目前AI產(chǎn)業(yè)發(fā)展的主要任務(wù)。對于大模型來說也是如此,各行業(yè)想要真正理解大模型的價值,應(yīng)用大模型的能力,首先需要以場景為先導(dǎo),以示范為坐標(biāo)。
百度移動生態(tài)對于大模型的深入應(yīng)用,正好可以構(gòu)成這種迫切為時代所需要的場景示范。從大模型走向產(chǎn)業(yè)轉(zhuǎn)化的路徑上看,百度移動首先證明了AIGC的可用性。AIGC作為大模型走向產(chǎn)業(yè)的重要一站,更多行業(yè)可以從百度的經(jīng)驗中消化并吸納AIGC的價值,從而實現(xiàn)自身的大模型落地。其次,百度移動生態(tài)與大模型融合,還證明了大模型與產(chǎn)業(yè)需求、產(chǎn)業(yè)真實情況的融合價值。百度移動生態(tài)擁有著巨大的流量以及多樣化的業(yè)務(wù),這些條件都是對大模型可用性的考驗。
知名經(jīng)濟學(xué)家任澤平也在萬象大會期間表示:“在AIGC的時代,百度APP作為‘前哨’和‘根據(jù)地’,是AIGC應(yīng)用最廣闊的天地,也將成為人人皆可用的AI新基建。這種‘百度搭臺,人人唱戲’的模式,將會激發(fā)全民更大的創(chuàng)造力,很多新模式、新應(yīng)用都會破土而出?!?/p>
從文心大模型與百度移動生態(tài)的結(jié)合,到AIGC產(chǎn)業(yè)實踐的探索,再到更多行業(yè)應(yīng)用大模型的可能,我們可以看到這個路徑為大模型的3.0階段帶來了三重價值。
1.自種自證:大模型的技術(shù)能力已經(jīng)趨向飽滿
百度移動生態(tài)對文心大模型的應(yīng)用,首先讓各行業(yè)的開發(fā)者看到了大模型能做什么,有著怎樣的想象力,而這歸其根本來自文心大模型的技術(shù)能力。大模型的種子,需要在土壤中證明自己的價值,而AIGC與百度移動生態(tài)就提供了這樣的土壤。以AI智能寫作為例, ERNIE 3.0 Zeus是文心大模型最新發(fā)布的融合任務(wù)相關(guān)知識的千億大模型,其在學(xué)習(xí)海量數(shù)據(jù)和知識的基礎(chǔ)上,進(jìn)一步學(xué)習(xí)百余種不同形式的任務(wù)知識,在各類任務(wù)表現(xiàn)出了更強的創(chuàng)作能力。從財經(jīng)、體育類新聞快訊,再到詩歌、小說等文學(xué)創(chuàng)作,AI寫作覆蓋的領(lǐng)域越來越廣,創(chuàng)作形式和內(nèi)容也變得更加豐富多彩。
今年高考期間,ERNIE 3.0 Zeus 加持的AI數(shù)字人度曉曉挑戰(zhàn)寫高考作文,以40秒40篇的速度,獲得了位列總考生前25%的成績。 ERNIE 3.0 Zeus的智能創(chuàng)作能力目前已經(jīng)對外開放,各行各業(yè)的廣大開發(fā)者可以在線體驗與定制ERNIE 3.0 Zeus的文本創(chuàng)作能力。再說說AI作畫,AI作畫這樣的AIGC應(yīng)用想要得到保障,背后是文心跨模態(tài)大模型的有力支撐,作為全球最大中文跨模態(tài)生成模型,文心ERNIE-ViLG參數(shù)規(guī)模已達(dá)100億,它將「文生成圖」和「圖生成文」任務(wù)融合到同一個模型進(jìn)行端到端學(xué)習(xí),從而增強文本和圖像的跨模態(tài)語義對齊。而近期文心ERNIE-ViLG文圖生成算法迎來升級,通過漸進(jìn)式擴散模型,生成空間由小及大、生成輪廓由粗到細(xì),同時根據(jù)生成階段自動選擇最優(yōu)生成網(wǎng)絡(luò),文本生成圖像的效果取得進(jìn)一步提升。可以說,每一幅AI畫作的背后,都有文心大模型技術(shù)能力飽滿的證明。
2.沃土通衢:產(chǎn)業(yè)工具與開發(fā)平臺逐漸完備
各行業(yè)、各領(lǐng)域中的開發(fā)者,想要真正用到大模型,就需要針對性的平臺與工具,從而降低技術(shù)獲取門檻,提升產(chǎn)業(yè)開發(fā)效率。為此,文心大模型在工具化、平臺化中進(jìn)行了豐富的探索。以AI作畫為例,文心一格是百度推出的AI藝術(shù)和創(chuàng)意輔助平臺,是百度依托于飛槳、文心大模型持續(xù)的技術(shù)創(chuàng)新,在“AI作圖”方面發(fā)布的產(chǎn)品。面向有設(shè)計需求和創(chuàng)意的人群,文心一格可以基于文心大模型智能生成多樣化AI創(chuàng)意圖片,輔助創(chuàng)意設(shè)計,打破創(chuàng)意瓶頸。對便捷性需求更高的開發(fā)者,還可以使用文心文圖生成大模型ERNIE-ViLG 服務(wù),極速獲得沉浸式文圖生成大模型的技術(shù)體驗,更可靈活方便、高效地實現(xiàn)產(chǎn)品集成。這樣我們可以看到,對AI作畫有不同需求、不同考量的開發(fā)者,都有平臺和工具來獲取自己想要的AIGC能力。這就是大模型走向行業(yè),走向應(yīng)用的沃土通衢。
3.禾下乘涼:大模型規(guī)?;瘧?yīng)用的開始
面向更廣闊的行業(yè)應(yīng)用前景與產(chǎn)業(yè)想象力,文心大模型不僅僅推動與百度業(yè)務(wù)的結(jié)合,更積極探索對外賦能的形式與方法。文心大模型具備的知識增強特性,本身就可以實現(xiàn)在實體問答、知識預(yù)測等領(lǐng)域獲得更好效果,提升大模型在行業(yè)場景中的可用性。同時,文心·行業(yè)大模型采用行業(yè)知識增強技術(shù)對行業(yè)特色數(shù)據(jù)與行業(yè)特色知識學(xué)習(xí),進(jìn)而提升大模型對行業(yè)應(yīng)用的適配性。目前文心已經(jīng)聯(lián)合國家電網(wǎng)、浦發(fā)銀行發(fā)布知識增強的電力行業(yè)NLP大模型“國網(wǎng)-百度·文心”、金融行業(yè)NLP大模型“浦發(fā)-百度·文心”,已在電力、金融相關(guān)任務(wù)完成落地應(yīng)用。在航天領(lǐng)域,文心大模型攜手中國航天發(fā)布世界上首個航天大模型——“航天-百度·文心大模型”,推進(jìn)航天領(lǐng)域AI技術(shù)應(yīng)用。
文心大模型早已推出了開發(fā)套件、API和內(nèi)置文心大模型能力的開發(fā)平臺,可以讓不同領(lǐng)域、不同需求的產(chǎn)業(yè)開發(fā)者以更低成本、更低門檻精準(zhǔn)獲得大模型賦能,促進(jìn)人工智能的進(jìn)一步廣泛應(yīng)用。
文心大模型在產(chǎn)業(yè)中加速落地,正在成為推動AIGC發(fā)展的新引擎,同時也在成為推動產(chǎn)業(yè)智能化的新基座。大模型的規(guī)?;瘧?yīng)用和落地千行百業(yè),或許就是我們期待的那個智能中國的禾下乘涼夢。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準(zhǔn)AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。