精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    清華大學(xué)教授孫茂松:理解大模型機(jī)理建立AI新理論

    7月27日消息,25日,清華大學(xué)人工智能研究院教授、歐洲人文和自然科學(xué)院外籍院士孫茂松在浦江基礎(chǔ)科學(xué)發(fā)展論壇期間接受采訪(fǎng)時(shí)表示,根據(jù)現(xiàn)有文本分析、不生成新文本的理解類(lèi)大模型不存在“幻覺(jué)”。但像ChatGPT這樣生成類(lèi)的大模型,對(duì)話(huà)需要與事實(shí)對(duì)齊,這還要付出很大的努力,也是目前的研究熱點(diǎn)。

    澎湃新聞報(bào)道,孫茂松表示,當(dāng)前業(yè)界對(duì)于ChatGPT的舉一反三還處于“知其然,不知其所以然”的階段,只有搞清楚大模型的機(jī)理,才有可能克服現(xiàn)有人工智能大模型的局限性,超越現(xiàn)有大模型,建立下一代人工智能理論和模型。而人工智能最前沿之爭(zhēng)就是人才的競(jìng)爭(zhēng),頂尖高手決定了人工智能的高度,廣泛的應(yīng)用決定了人工智能的廣度。

    理解大模型機(jī)理,才能克服局限建立下一代AI理論

    人們常常忽略語(yǔ)言的重要性,因?yàn)檎Z(yǔ)言自然得就像空氣一樣。但只有人類(lèi)才有語(yǔ)言能力,語(yǔ)言的地位極其重要。而ChatGPT的出現(xiàn)讓機(jī)器也有了語(yǔ)言對(duì)話(huà)的能力,孫茂松說(shuō),這是5000年未有之變局,也會(huì)催生一系列新應(yīng)用。

    但對(duì)于ChatGPT,“現(xiàn)在是知其然,不知其所以然。OpenAI開(kāi)發(fā)出了這樣的現(xiàn)象,但為何會(huì)產(chǎn)生智能涌現(xiàn)這樣的現(xiàn)象還說(shuō)不清?,F(xiàn)在人工智能領(lǐng)域的大公司、大機(jī)構(gòu)都在拼命往前跑,把大模型效果做得更好,還沒(méi)有時(shí)間停下來(lái)深刻地思考大模型的機(jī)理。”孫茂松表示,這就像蒸汽機(jī)帶來(lái)了工業(yè)革命,但直到大約100年后在熱力學(xué)三定律之下才解釋清楚。

    大模型里的元素事關(guān)數(shù)學(xué),當(dāng)前大模型的參數(shù)到了萬(wàn)億級(jí),應(yīng)用數(shù)學(xué)家從來(lái)沒(méi)有解過(guò)如此大的方程組,并且大模型涉及到的數(shù)學(xué)問(wèn)題與經(jīng)典數(shù)學(xué)完全不同,這為理解大模型機(jī)理帶來(lái)了挑戰(zhàn)。

    但孫茂松認(rèn)為,只有搞清楚大模型的機(jī)理,才有可能克服現(xiàn)有人工智能大模型的局限性,超越現(xiàn)有大模型,建立下一代人工智能理論和模型。而這不會(huì)再像蒸汽機(jī)那樣需要100年才能理解機(jī)理,他相信三五年時(shí)間就能突破大模型的機(jī)理研究。

    語(yǔ)料利用處于粗放階段,減少大模型幻覺(jué)是研究熱點(diǎn)

    目前大模型的語(yǔ)料利用還處于粗放階段,僅僅是從互聯(lián)網(wǎng)上抓取語(yǔ)料,還沒(méi)有涉及網(wǎng)頁(yè)中的超鏈接和圖片處理、文本結(jié)構(gòu)的識(shí)別與利用等。孫茂松表示,“大模型寫(xiě)短文可以寫(xiě)得很好,但寫(xiě)長(zhǎng)文、短篇小說(shuō)不行,它沒(méi)有辦法保持大邏輯流暢、人物角色連貫。因?yàn)榇竽P途褪菍?duì)下一個(gè)詞的預(yù)測(cè),預(yù)測(cè)得再好,它對(duì)語(yǔ)料的利用還是有深刻的不足?!?/p>

    除此之外,孫茂松表示,要對(duì)語(yǔ)料質(zhì)量保持足夠關(guān)注,剔除語(yǔ)言不通順的語(yǔ)料、計(jì)算機(jī)生成的語(yǔ)料,利用質(zhì)量好的語(yǔ)料。但水至清則無(wú)魚(yú),越純的語(yǔ)料可能導(dǎo)致多樣性損失,例如喂給大模型的都是“高大上的語(yǔ)料”,大模型就看不懂帶有表情符號(hào)的語(yǔ)料。因此要追求平衡,根據(jù)應(yīng)用判斷什么是好的語(yǔ)料。

    大模型存在“幻覺(jué)”,常常一本正經(jīng)地“胡說(shuō)八道”。但孫茂松表示,“幻覺(jué)”是能力強(qiáng)的表現(xiàn),是創(chuàng)新的源泉。大模型分為生成模型和理解模型,前者如ChatGPT,孫茂松說(shuō),以前要讓計(jì)算機(jī)通順地說(shuō)話(huà)是做不到的,因?yàn)樵~與詞的組合關(guān)系復(fù)雜?,F(xiàn)在做到了通順,但并不意味著所說(shuō)的話(huà)是正確的,語(yǔ)義層、語(yǔ)用層都需要和現(xiàn)實(shí)世界對(duì)齊。

    “比如機(jī)器回答在上海城隍廟吃了上海小籠包和上??绝?,從語(yǔ)言角度來(lái)看,這都沒(méi)有問(wèn)題。哪個(gè)更符合事實(shí),它就不知道了,這就需要人介入進(jìn)來(lái)?!睂O茂松表示,大模型的對(duì)話(huà)需要與事實(shí)對(duì)齊,這還要付出很大的努力,也是目前的研究熱點(diǎn)。

    對(duì)于后者,模型根據(jù)現(xiàn)有文本進(jìn)行分析,不生成新的文本,只理解不說(shuō)話(huà),就不存在“幻覺(jué)”。利用這種理解模型,打通語(yǔ)料,讓機(jī)器自主學(xué)習(xí),就可以依靠模型查詢(xún)相似詩(shī)句,例如哪一詩(shī)句和杜甫《絕句》中的“一行白鷺上青天”最接近?大模型的回答是宋代《野景》中的“白鷺一行登碧霄”,這就是大模型所擅長(zhǎng)的。

    AI最前沿之爭(zhēng)是人才的競(jìng)爭(zhēng),頂尖高手決定高度

    這一波人工智能浪潮起于2010年,彼時(shí)學(xué)術(shù)界和工業(yè)界都在開(kāi)足馬力研究,積累了充分的經(jīng)驗(yàn),ChatGPT的出現(xiàn)為人工智能點(diǎn)了一把火。孫茂松表示,國(guó)內(nèi)的“百模大戰(zhàn)”并非貶義,而是實(shí)力的象征。未來(lái)通用大模型支撐垂直模型的開(kāi)發(fā),絕大多數(shù)從業(yè)者將不會(huì)把主要精力放在基礎(chǔ)模型上,而是面向行業(yè)應(yīng)用開(kāi)發(fā)垂直模型。

    但在通用大模型方面,“我們確實(shí)在跟跑,跟領(lǐng)跑者的差距很明顯。這半年我們把差距縮小了,但沒(méi)有質(zhì)的變化。”孫茂松表示,在ChatGPT之前,國(guó)內(nèi)的大模型研究和國(guó)外相比差半個(gè)肩位,ChatGPT出現(xiàn)后甩開(kāi)100米,這半年追了幾十米,但在關(guān)鍵性能上還有差距。如果能夠研究透徹大模型的機(jī)理,就可能棋高一著。

    無(wú)論是模型還是應(yīng)用,都離不開(kāi)硬件廠(chǎng)商或云服務(wù)商,算力目前是最稀缺的資源。啟明創(chuàng)投發(fā)布的《生成式AI》報(bào)告顯示,GPU的性能實(shí)際上決定了這個(gè)新興行業(yè)的步調(diào),但從長(zhǎng)期來(lái)看,人才對(duì)人工智能未來(lái)的影響超過(guò)算力。

    孫茂松同樣認(rèn)為,人工智能最前沿之爭(zhēng)就是人才的競(jìng)爭(zhēng),頂尖高手決定了人工智能的高度,廣泛的應(yīng)用決定了人工智能的廣度。人工智能的發(fā)展需要一流的人才,這些人才除了具備頂尖的能力,還要有遠(yuǎn)大的科學(xué)理想、敏銳的洞察力和對(duì)技術(shù)的激情。

    免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

    2023-07-27
    清華大學(xué)教授孫茂松:理解大模型機(jī)理建立AI新理論
    AI最前沿之爭(zhēng)就是人才的競(jìng)爭(zhēng)。

    長(zhǎng)按掃碼 閱讀全文