丨劃重點(diǎn)
1. 大模型火爆是因?yàn)樵陂_(kāi)放領(lǐng)域任務(wù)上超預(yù)期的表現(xiàn),尤其是具備理解能力,可以將其稱之為「智能涌現(xiàn)」。
2. 基礎(chǔ)大模型的訓(xùn)練是基于公開(kāi)、經(jīng)過(guò)整理的可信內(nèi)容,而下游任務(wù)(比方說(shuō)對(duì)話任務(wù))則需要對(duì)特定的數(shù)據(jù)進(jìn)行人工標(biāo)記。
3. 頭部大廠和資深從業(yè)者紛紛下場(chǎng)創(chuàng)業(yè),人才與市場(chǎng)將是中國(guó)大模型的優(yōu)勢(shì)。
4. 大模型扎堆有助于人才培養(yǎng),暫時(shí)還是小規(guī)模試驗(yàn),不會(huì)出現(xiàn)并購(gòu)、倒閉潮。
5. 大型模型是一個(gè)產(chǎn)品和工具,提供方應(yīng)該承擔(dān)責(zé)任,停止所有AI或大模型產(chǎn)品開(kāi)發(fā)不太可能。
丨概述
過(guò)去一個(gè)季度,GPT-3.5和GPT-4持續(xù)的在全網(wǎng)刷屏,成功將OpenAI推上科技創(chuàng)新風(fēng)口,也間接帶火了大語(yǔ)言模型創(chuàng)業(yè)浪潮。
在硅谷,微軟率先在產(chǎn)品中接入ChatGPT,谷歌也推出了自己的Bard模型;在中國(guó)內(nèi)地,百度、阿里巴巴們先后推出了文心一言、通義千問(wèn),王小川、王慧文等資深互聯(lián)網(wǎng)從業(yè)者,先后投身到大模型創(chuàng)業(yè)當(dāng)中。
然而,大模型在刷新人們對(duì)人工智能能力認(rèn)知上限的同時(shí),也因?yàn)樵趥惱?、道德等方面存在的?wèn)題而引發(fā)爭(zhēng)議,也因此馬斯克等知名從業(yè)者發(fā)起了聯(lián)名信,呼吁暫停GPT-4以上大模型6個(gè)月的研發(fā)時(shí)間,從而引發(fā)行業(yè)大討論。
4月19日20:00,《亮見(jiàn)》聯(lián)合騰訊科技,特邀清華大學(xué)國(guó)強(qiáng)教授、智能產(chǎn)業(yè)研究院首席研究員 聶再清博士,為公眾梳理人工智能發(fā)展過(guò)程中的問(wèn)題與挑戰(zhàn)以及創(chuàng)業(yè)機(jī)會(huì)。
以下是直播文字精華版:
01
訓(xùn)練數(shù)據(jù)爆發(fā)讓大模型「智能涌現(xiàn)」
劉興亮:能否簡(jiǎn)要介紹大模型是什么,能做些什么?
聶再清:大模型即大規(guī)模預(yù)訓(xùn)練模型,是使用海量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練的深度學(xué)習(xí)模型,這些模型一般具有大量參數(shù),可以理解為人類知識(shí)和語(yǔ)言的壓縮器。
大模型的應(yīng)用場(chǎng)景豐富,對(duì)于英文水平不夠好的人,英語(yǔ)翻譯就是最有用的場(chǎng)景。眾所周知,許多國(guó)際期刊要求論文用英語(yǔ)寫(xiě)作,這給中國(guó)研究人員帶來(lái)了不利因素。然而,通過(guò)ChatGPT這類產(chǎn)品,可以很好的幫助作者提高英語(yǔ)論文的流利度,當(dāng)然還有許多人使用它來(lái)輔助準(zhǔn)備演講稿、總結(jié),甚至創(chuàng)作詩(shī)歌等等。
大模型也具備將搜索結(jié)果和其他信息結(jié)合在一起的能力,不過(guò)不能保證每一條結(jié)果都是正確的,但大部分通過(guò)搜索結(jié)果總結(jié)出的內(nèi)容是可信的。
和過(guò)去相比,搜索引擎提供了查找信息的能力,大模型為我們提供了更廣闊的想象空間。當(dāng)越來(lái)越多的第三方廠商加入這個(gè)領(lǐng)域時(shí),它們可以在我們的日常生活中提供更多的便利的插件,這也是當(dāng)初我們開(kāi)發(fā)智能助手時(shí)的愿景,希望它能成為新的交互入口。
劉興亮:現(xiàn)在大模型非常的火爆,主要原因是什么,它是如何發(fā)展到現(xiàn)在的?
聶再清:大模型火爆主要是因?yàn)樵陂_(kāi)放領(lǐng)域任務(wù)上的表現(xiàn),讓人出乎意料,具備理解能力,我稱之為智能涌現(xiàn),其能力的提升則是通過(guò)增加數(shù)據(jù)量的同時(shí),擴(kuò)大模型參數(shù)規(guī)模來(lái)實(shí)現(xiàn)的。通過(guò)模型規(guī)模擴(kuò)大帶來(lái)了能力的提升,也帶來(lái)了不同階段的下游任務(wù)學(xué)習(xí)范式
它的發(fā)展歷程主要分為三個(gè)階段:
第一階段(預(yù)訓(xùn)練+Fine-tuning):2018年左右這個(gè)領(lǐng)域開(kāi)始被廣泛關(guān)注,預(yù)訓(xùn)練模型不是非常大。在下游機(jī)器學(xué)習(xí)的自然語(yǔ)言任務(wù)上,通過(guò)使用一些訓(xùn)練數(shù)據(jù),可以顯著提高任務(wù)處理能力。
第二階段(預(yù)訓(xùn)練+Prompt-tuning),2019年后,GPT-2和GPT-3這些模型陸續(xù)亮相,這些模型具有提示學(xué)習(xí)的能力,可以在只給定幾個(gè)示例的情況下預(yù)測(cè)完成下游文本任務(wù)。
第三階段(預(yù)訓(xùn)練+Instruction-tuning),2022年后,出現(xiàn)了被稱為Instruction Learning的學(xué)習(xí)范式,可以通過(guò)在前n個(gè)任務(wù)上進(jìn)行學(xué)習(xí),提升在第n+1個(gè)任務(wù)上進(jìn)行預(yù)測(cè)的性能,主要優(yōu)點(diǎn)是讓模型更加通用和開(kāi)放,可以應(yīng)用于更廣泛的任務(wù)和場(chǎng)景。
劉興亮:大模型的數(shù)據(jù)是從哪里來(lái),使用權(quán)限如何界定,有哪些手段來(lái)保障數(shù)據(jù)的安全,尤其是生物醫(yī)藥的數(shù)據(jù)安全又怎么樣去保障?
聶再清:在基礎(chǔ)大模型訓(xùn)練階段主要使用公共數(shù)據(jù),包括我們的BioMedGPT也是基于公開(kāi)數(shù)據(jù)構(gòu)建的。
語(yǔ)言模型更多地使用百科全書(shū)、新聞、電子書(shū)等由人類撰寫(xiě)的、更為真實(shí)的文本,這些經(jīng)過(guò)整理的、真實(shí)的、具備人類智慧的文本被輸入到這個(gè)模型中,讓它學(xué)會(huì)更多的知識(shí)。
在利用大模型解決下游任務(wù)階段,可能需要標(biāo)注更多的任務(wù)相關(guān)數(shù)據(jù),需要花費(fèi)一定的費(fèi)用。
比如GPT3發(fā)布初期,業(yè)界可能沒(méi)有感到驚艷,直到有了切實(shí)的對(duì)話大模型(ChatGPT),讓用戶標(biāo)注對(duì)話數(shù)據(jù)以完成不同領(lǐng)域的對(duì)話任務(wù),才讓每個(gè)人感到驚奇,而這種能力是通過(guò)用戶對(duì)話數(shù)據(jù)標(biāo)注和強(qiáng)化學(xué)習(xí)來(lái)獲得的。
除了標(biāo)注,還有一部分?jǐn)?shù)據(jù)是用戶反饋的,這些數(shù)據(jù)可以幫助提高系統(tǒng)能力,也很有價(jià)值的。
還有一部分?jǐn)?shù)據(jù)來(lái)自模型的客戶或個(gè)人用戶的私有數(shù)據(jù),客戶可能會(huì)提供大量數(shù)據(jù)用于回答問(wèn)題,但這部分?jǐn)?shù)據(jù)應(yīng)該屬于客戶或用戶私有,不用用來(lái)訓(xùn)練公共使用的大模型。需要注意保護(hù)客戶和個(gè)人用戶的隱私。
因此,需要區(qū)分不同類型的數(shù)據(jù),并授權(quán)相應(yīng)的權(quán)限,有些數(shù)據(jù)只能由用戶處理,有些數(shù)據(jù)可供平臺(tái)公司使用,但隱私數(shù)據(jù)絕對(duì)不能使用。
02
人才與市場(chǎng)將是中國(guó)大模型的優(yōu)勢(shì)
劉興亮:頭部大廠、知名人士紛紛下場(chǎng)做大模型創(chuàng)業(yè),他們各自都有哪些長(zhǎng)處和短處?
聶再清:我認(rèn)為大模型應(yīng)用可分為三類,對(duì)應(yīng)著不同類型的團(tuán)隊(duì)。
第一類是提供云服務(wù)的大廠,他們需要在其基礎(chǔ)設(shè)施上提供高質(zhì)量的大型模型服務(wù)。未來(lái)是大模型的時(shí)代,沒(méi)有這樣的服務(wù),就會(huì)失去競(jìng)爭(zhēng)力。好處在于,大廠通常建立了成熟的生態(tài)系統(tǒng),擁有豐富的計(jì)算資源,可以相對(duì)容易地進(jìn)行大模型投資。
第二類是創(chuàng)業(yè)公司,比較靈活,沒(méi)有大廠的包袱,決策速度快,但是他們需要長(zhǎng)期投入大量的計(jì)算資源和精力,來(lái)開(kāi)發(fā)大模型的相關(guān)業(yè)務(wù),而投資人需要有足夠的耐心和信心等待收益,這可能是個(gè)劣勢(shì)。
第三類是傳統(tǒng)業(yè)務(wù)廠商,已有成熟的業(yè)務(wù)和穩(wěn)定的客戶,只需要通過(guò)接入大型模型,來(lái)更新他們的服務(wù)能力,以更好地服務(wù)客戶并增加收入,缺點(diǎn)是這類企業(yè)可能沒(méi)有足夠的人工智能技術(shù)人才和計(jì)算資源,用以投入到新技術(shù)開(kāi)發(fā)中。
劉興亮:中國(guó)在大模型業(yè)務(wù)上,有哪些優(yōu)勢(shì),又有哪些難點(diǎn)?
聶再清:優(yōu)勢(shì)有很多。首先是人才,特別是計(jì)算機(jī)領(lǐng)域,相關(guān)人才的數(shù)學(xué)、計(jì)算機(jī)技能普遍很好,尤其是人工智能領(lǐng)域,人才更是不缺。此外,有廣闊的市場(chǎng)和需求。
劣勢(shì)在于,ChatGPT并非出自中國(guó),部分資料并不掌握,需要花更多時(shí)間去探索和研究。此外,是否會(huì)有一些投資機(jī)構(gòu)或資源方愿意長(zhǎng)期地投入大量資源到創(chuàng)新領(lǐng)域,尤其在短期內(nèi)看不到商業(yè)效益也愿意持續(xù)大額投入?
沒(méi)有幾個(gè)國(guó)家的投資機(jī)構(gòu)能夠?qū)⒋罅康馁Y金投入到短期看起來(lái)毫無(wú)商業(yè)價(jià)值的無(wú)用研究中,然而這些看似無(wú)用的研究,往往是非常關(guān)鍵的基礎(chǔ)創(chuàng)新技術(shù)的來(lái)源。
劉興亮: 當(dāng)前大模型的形式主要還是聊天機(jī)器人,這并不新鮮,為什么今天的產(chǎn)品會(huì)讓大家這么吃驚?
聶再清:對(duì)話引擎,從傳統(tǒng)的角度來(lái)看,它可以被分為兩類。
第一類是開(kāi)放式的閑聊,用戶可以隨意交流,用戶說(shuō)一句話,機(jī)器人回答一句話,這種對(duì)話對(duì)(QA pair)數(shù)據(jù)可以從積累的海量對(duì)話數(shù)據(jù)庫(kù)中獲取,也可以AI自動(dòng)生成,機(jī)器回復(fù)通常信息量比較少,這樣可減少回復(fù)錯(cuò)誤(言多必失)。
另一種是任務(wù)型對(duì)話,也稱為任務(wù)完成型對(duì)話,這種對(duì)話是為了完成特定的任務(wù),例如用戶要聽(tīng)一首歌曲,需要先了解用戶想要聽(tīng)的歌曲參數(shù),例如歌曲名和歌手名,將這些信息連接到知識(shí)圖譜上,以便系統(tǒng)能夠獲取歌曲的ID,其次是進(jìn)行個(gè)性化推薦,讓用戶繼續(xù)享受這個(gè)體驗(yàn)。
現(xiàn)在隨著ChatGPT的出現(xiàn),開(kāi)放域任務(wù)也能夠?qū)崿F(xiàn)很高的理解精度,這是非常令人興奮的。
不過(guò)智能助手業(yè)務(wù)公司在封閉域任務(wù)完成和開(kāi)放域之間,也應(yīng)嘗試做一些平衡,由于早期GPT的理解能力還有限,作為廠商也需要保證每句話都是正確的,不能傷害用戶。如果GPT因?yàn)椴荒芎芎玫睦斫舛霈F(xiàn)錯(cuò)誤,修復(fù)這類問(wèn)題需要大量的投入。
03
大模型創(chuàng)業(yè)潮推動(dòng)數(shù)字化轉(zhuǎn)型
劉興亮:目前大模型扎堆,會(huì)不會(huì)存在資源浪費(fèi)的問(wèn)題,是否會(huì)重現(xiàn)團(tuán)購(gòu)、共享單車這樣的并購(gòu)、倒閉潮?
大廠大模型進(jìn)展,圖源:晚點(diǎn)LatePost
聶再清:在開(kāi)始階段時(shí),大模型驚艷的能力對(duì)人們?cè)斐傻臎_擊太大,大家不可避免地都想去試一試,我認(rèn)為這沒(méi)有問(wèn)題。這樣做的好處在于,可以培養(yǎng)更多的人才。如果不這樣做,大家都沒(méi)有經(jīng)驗(yàn),也就不會(huì)訓(xùn)練出一批人才。然而,總是會(huì)有資本沒(méi)有耐心等的,未來(lái)一定會(huì)進(jìn)行動(dòng)態(tài)調(diào)整。
假設(shè),有60家公司都做通用大模型,那么后面40家公司就會(huì)有人融不到資,部分人就會(huì)加入到一個(gè)頭部,使頭部的資源更加強(qiáng)大。但是,目前階段還不會(huì)有太大浪費(fèi)的問(wèn)題,最終(新產(chǎn)業(yè))培養(yǎng)出的人才和經(jīng)驗(yàn),將集中在頭部公司。現(xiàn)階段并購(gòu)潮不太可能,早期應(yīng)該大部分公司現(xiàn)在還只是小規(guī)模試驗(yàn)而已。
劉興亮:從應(yīng)用的層面來(lái)看,未來(lái)大模型會(huì)在哪些業(yè)帶來(lái)重大改變,有哪些創(chuàng)業(yè)機(jī)會(huì),對(duì)創(chuàng)業(yè)者有什么建議?
聶再清:我認(rèn)為創(chuàng)業(yè)有很多機(jī)會(huì)。
其中一類機(jī)會(huì)是基于大模型的應(yīng)用。每個(gè)行業(yè)都可以借助大模型來(lái)實(shí)現(xiàn)數(shù)字化,實(shí)現(xiàn)業(yè)務(wù)的最佳效果,但不是所有企業(yè)都有資源投入大模型研發(fā),需要產(chǎn)業(yè)相關(guān)的大模型技術(shù)服務(wù)公司來(lái)幫助這些企業(yè)加入到大模型浪潮。
另外一類機(jī)會(huì)是在垂直行業(yè)中推出大模型的公司,這些行業(yè)只有具備了解特定數(shù)據(jù)和業(yè)務(wù),才需要打造行業(yè)內(nèi)部的垂直大模型。例如,生命科學(xué)領(lǐng)域就有很多這樣的任務(wù),因?yàn)樗鼡碛性S多細(xì)分?jǐn)?shù)據(jù),這些數(shù)據(jù)又需要具備行業(yè)知識(shí)。
第三類機(jī)會(huì)是基于大模型開(kāi)發(fā)新產(chǎn)品、插件,這可能涉及硬件和傳統(tǒng)軟件等等,這種產(chǎn)品將提供全新的用戶體驗(yàn)。
總之,大型模型將會(huì)帶來(lái)很多機(jī)會(huì),核心則是利用其推動(dòng)數(shù)字化轉(zhuǎn)型。
劉興亮:普通人在這樣的背景下能做什么?
聶再清:普通用戶,需要盡快掌握大模型產(chǎn)品、工具的使用,比如英文寫(xiě)作,利用其提高工作效率。
04
風(fēng)險(xiǎn)在于隱私安全,大模型應(yīng)當(dāng)擔(dān)責(zé)
劉興亮:大模型產(chǎn)品落地過(guò)程中,出現(xiàn)了眾多負(fù)面討論,馬斯克也呼吁暫停開(kāi)發(fā),人們的擔(dān)憂可能是什么?
聶再清:我認(rèn)為這種技術(shù)可能存在以下幾種潛在的風(fēng)險(xiǎn)。
一種風(fēng)險(xiǎn)是有可能對(duì)社會(huì)或用戶構(gòu)成一定程度的干擾。因?yàn)榧词辜夹g(shù)非常強(qiáng)大,但也不能保證每句話都是正確的,潛在的風(fēng)險(xiǎn)就是可能會(huì)刺激到一些精神比較脆弱的用戶,或者會(huì)挑起種族矛盾,甚至?xí)嬖跈C(jī)密信息泄露等國(guó)家安全方面的風(fēng)險(xiǎn)。
另一個(gè)可能的風(fēng)險(xiǎn)是用戶隱私、客戶數(shù)據(jù)的泄露,這些平臺(tái)是否能夠采取措施,來(lái)防止這種情況發(fā)生,是否都已經(jīng)做好了必要的檢查,這是需要回答的問(wèn)題。
另外,這種技術(shù)可能會(huì)對(duì)教育產(chǎn)生重大影響,特別是對(duì)孩子的教育,因?yàn)檫@項(xiàng)技術(shù)可以提供大量知識(shí),未來(lái)的教育如何利用好大模型?有了大模型我們的知識(shí)教育方式是否需要調(diào)整?如果沒(méi)有認(rèn)真思考過(guò)這些問(wèn)題,可能會(huì)對(duì)下一代的教育造成負(fù)面影響。
當(dāng)然,我認(rèn)為現(xiàn)階段還沒(méi)必要過(guò)度擔(dān)憂,大模型技術(shù)總體來(lái)看還是安全可控的。
劉興亮: 大模型在不斷進(jìn)化過(guò)程中,會(huì)出現(xiàn)很多事實(shí)性錯(cuò)誤,如果用戶過(guò)度依賴而造成負(fù)面影響,誰(shuí)來(lái)?yè)?dān)責(zé)任,應(yīng)如何治理?
聶再清:大型模型是一個(gè)產(chǎn)品和工具,而只要是產(chǎn)品和工具,提供方應(yīng)該承擔(dān)責(zé)任。當(dāng)然,也需要監(jiān)管部門(mén)幫助建立、完善創(chuàng)新機(jī)制和環(huán)境,既要鼓勵(lì)積極的創(chuàng)新,又要限制有害創(chuàng)新,尤其是對(duì)于大模型,安全和可控是前提條件。
劉興亮:可能什么樣的情況下,人類會(huì)暫停AI產(chǎn)品開(kāi)發(fā)?
聶再清:我認(rèn)為停止所有AI或大模型產(chǎn)品的開(kāi)發(fā)是不太可能的,但如果這些技術(shù)或產(chǎn)品對(duì)客戶/用戶造成了傷害或風(fēng)險(xiǎn),監(jiān)管部門(mén)可以要求停止使用具體的某項(xiàng)技術(shù)或產(chǎn)品,并進(jìn)行檢查和整改。必須通過(guò)流程和機(jī)制,確保每一個(gè)產(chǎn)品都是安全的。
劉興亮:在特定領(lǐng)域,比如生物醫(yī)藥大模型,有沒(méi)有可能受商業(yè)利益驅(qū)使推薦藥品,這種情況可能會(huì)出現(xiàn)嗎?
聶再清:對(duì)于我們的生物醫(yī)藥大模型BioMedGPT,核心是幫助設(shè)計(jì)新藥,而不是現(xiàn)有藥品銷售。當(dāng)然,未來(lái)有有可能向醫(yī)生提供藥品推薦的服務(wù),但最終要由醫(yī)生做決策。
此外,大模型可以向醫(yī)生提供疾病的病因和治療建議,提供相應(yīng)的數(shù)據(jù)參考,進(jìn)而輔助醫(yī)療效率提升,在這方面的應(yīng)用空間也很大。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 2024年劇集氪金力大盤(pán)點(diǎn)
- “共創(chuàng)”、“造?!背身斄?,傳統(tǒng)品牌緣何要花式出圈?
- 人形機(jī)器人瘋狂進(jìn)廠打工!銀河通用、智元、樂(lè)聚機(jī)器人怕是都瘋了
- 折疊手機(jī)猛增三成,但是卻也到了崩盤(pán)邊緣,違背人性必被拋棄
- 因?yàn)樗投Y電商!2025微信、抖音、淘寶又撕破了臉
- 中國(guó)手機(jī)市場(chǎng)成績(jī)單:華為增長(zhǎng)最快,蘋(píng)果跌幅最大
- 原以為微軟、亞馬遜、阿里云云計(jì)算大局已定!沒(méi)想到有這四大變數(shù)
- 崖州灣之旅:看見(jiàn)海與智能,聯(lián)想到了未來(lái)
- 榮耀換帥,一艘AI巨輪的舵手更替會(huì)帶來(lái)什么?
- 泳池機(jī)器人Aiper,從價(jià)值鏈高處“游”進(jìn)全球庭院
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。