精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<rt id="ovl0v"><tt id="ovl0v"></tt></rt>

<label id="ovl0v"></label>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

參照人類大腦，學(xué)會忘記會讓AI大模型變得更好？

人閱讀
2024-03-12 10:09:44
來源：極客網(wǎng)
作者：小刀
相關(guān)關(guān)鍵詞

極客網(wǎng)·人工智能3月12日 計算機科學(xué)家團(tuán)隊近期開發(fā)出一種更敏捷更具彈性的機器學(xué)習(xí)模型，它們可以周期性忘記已知信息，而現(xiàn)有大語言模型不具備忘卻能力。

實測表明，在很多情況下，“忘卻法”的訓(xùn)練效率很高，忘卻型模型表現(xiàn)也會更好。韓國基礎(chǔ)科學(xué)研究院（Institute for Basic Science）的AI工程師Jea Kwon說，新研究意味著AI領(lǐng)域取得明顯進(jìn)步。

QQ截圖20240312100914.jpg

“忘卻法”訓(xùn)練效率很高

今天的AI語言引擎大多都是人工神經(jīng)網(wǎng)絡(luò)驅(qū)動的。網(wǎng)絡(luò)中的每一個“神經(jīng)元”都是一個數(shù)學(xué)函數(shù)，它會從其它神經(jīng)元接收信號，它會運算，然后通過多層神經(jīng)元發(fā)送信號。

最開始時信息流或多或少都是隨機的，當(dāng)網(wǎng)絡(luò)不斷與訓(xùn)練數(shù)據(jù)匹配，神經(jīng)元之間流動的信息會不斷優(yōu)化。例如，如果研究人員想訓(xùn)練一個雙語翻譯模型，它首先要收集海量雙語文本，用文本訓(xùn)練模型，它會調(diào)整神經(jīng)元之間的連接，將一種語言中的文本與另一種語言中的等效單詞聯(lián)系起來。

上述訓(xùn)練會耗費大量計算力。如果模型運行時不夠出色，如果后來用戶的需求變了，模型會很難匹配。

新模型研究人員Mikel Artetxe說：“假設(shè)你有一個模型，里面包含100種語言，有1種語言沒有被覆蓋。如果你想將這種語言添加進(jìn)去，那就要重新訓(xùn)練?！?/p>

幾年前，Artetxe和同事用1種語言訓(xùn)練神經(jīng)網(wǎng)絡(luò)，他們抹去神經(jīng)網(wǎng)絡(luò)所知的單詞組成信息，也就是所謂的“Tokens”。Tokens存儲在神經(jīng)網(wǎng)絡(luò)的第一層，它也叫“嵌入層”。對于其它層，不去理睬。抹去第1語言的Tokens之后，用第2種語言訓(xùn)練，第2種語言新的Tokens可以填充到嵌入層。

雖然模型包含大量不匹配信息，但仍然可以用第2種語言重新訓(xùn)練，也就是說模型可以學(xué)習(xí)、處理第2種語言。研究人員認(rèn)為，雖然嵌入層存儲了第2種語言的語匯特殊信息，但神經(jīng)網(wǎng)絡(luò)更底層存儲了抽象信息，它涉及到人類語言的幕后概念，正是這些概念幫助模型學(xué)習(xí)第二種語言。

研究報告作者Yihong Chen認(rèn)為：“我們生活在相同的世界，用不同語言的不同詞匯來賦予相同事物以概念。所以在模型之中會有相同等級的推理，比如一個蘋果，它是甜的，美味的，它不只是一個詞匯。”

將新語言添加到已訓(xùn)練模型中，采用“忘卻法”效率很高，盡管如此，還是需要重新訓(xùn)練，仍然需要海量數(shù)據(jù)和強大的處理能力。有沒有更好的辦法？當(dāng)然有，不需要訓(xùn)練，直接抹去嵌入層，然后再訓(xùn)練，也就是在初步訓(xùn)練時周期性重置嵌入層。

Artetxe稱：“如此一來，整個模型就能適應(yīng)重置。如果你想擴展模型，讓它適應(yīng)另一種語言，過程會變得更容易?！?/p>

忘卻型模型表現(xiàn)更好

研究人員用一種比較通用的大語言模型Roberta做實驗，采用周期性忘卻技術(shù)訓(xùn)練，將它與那些用標(biāo)準(zhǔn)、非忘卻方法訓(xùn)練的模型作比較。結(jié)果發(fā)現(xiàn)，在處理第1種語言時，忘卻型模型得分85.1分，傳統(tǒng)標(biāo)準(zhǔn)模型得分86.1分。再用第2種語言訓(xùn)練，只用約500萬Tokens（第一種語言用了700億）訓(xùn)練，忘卻型模型的精準(zhǔn)度得分降至62.7分，標(biāo)準(zhǔn)模型降到53.3分。

再訓(xùn)練時如果研究人員施加計算限制，忘卻型模型的表現(xiàn)會更好。例如，當(dāng)研究人員將訓(xùn)練長度從125000步短到5000步，忘卻型模型的平均得分約為57.8分，標(biāo)準(zhǔn)模型降到37.2分，幾乎和猜測差不多。

因此研究人員得出結(jié)論：在學(xué)習(xí)語言時，忘卻型模型表現(xiàn)更好一些。

魁北克深度學(xué)習(xí)研究中心Mila的研究人員Evgenii Nikishin認(rèn)為：“因為模型在訓(xùn)練時不斷忘卻，然后再重新學(xué)習(xí)，所以后面再教網(wǎng)絡(luò)一些新東西時會變得更容易些?！狈N種跡象顯示，模型理解語言時會從更深層次著眼，不只是了解單個詞匯的意思。

忘卻法與人類大腦的運行模式有些相似。舊金山大學(xué)神經(jīng)科學(xué)家Benjamin Levy認(rèn)為：“存儲大量詳細(xì)信息時人類記憶是相當(dāng)不精準(zhǔn)的。但人類大腦可以記住經(jīng)驗要點，記住抽象信息，而且擅長推斷。讓AI像人類一樣處理信息，比如讓它具備忘卻能力，AI也許會更有彈性?！?/p>

Yihong Chen認(rèn)為，未來也許會出現(xiàn)制造語言模型的工廠，這樣的工廠需要忘卻型技術(shù)，它是一個基本模型，可以快速適應(yīng)新領(lǐng)域。（小刀）

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

為您推薦

極客觀察

欄目相關(guān)

贊助商

極客網(wǎng)熱搜關(guān)鍵詞

人工智能 AI OpenAI ChatGPT 機器學(xué)習(xí) 生成式AI AI芯片 AIGC U-Mail AI大模型世界人工智能大會 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術(shù) 谷歌AI 蘋果AI GenAI 科大訊飛AI學(xué)習(xí)機百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機華為AI 松鼠AI AI+ 昇騰AI創(chuàng)新大賽微軟AI AIS Airdoc WAIC AITO 阿爾法蛋AI詞典筆京東AI 智譜AI AI模型 SoleusAir aigo SoleusAir舒樂氏 LIFAair 2019世界人工智能大會 AI機器人人工智能大會 AI創(chuàng)企移動AI時代浙大AIF 人工智能技術(shù) AI應(yīng)用 Zain AI醫(yī)療 AI算力 xAI AI人才人工智能芯片 Airtag AI時代騰訊AI AI服務(wù)器 AI算法 AI投資 BrainCo AI框架 Gmail 聯(lián)想AI VAIO 人工智能計算中心 Airwallex空中云匯人工智能大賽 Chain AI教育 Coremail AI搜索 OPENAIGC開發(fā)者大賽 AI賦能谷歌人工智能 AI眼鏡人工智能名片 Airwheel Mirai 昇騰AI開發(fā)者創(chuàng)享日人工智能機器人 AI聊天機器人阿里AI AI音樂 BrainCo強腦科技 AI計算人工智能+ 浪潮KaiwuDB 阿爾法蛋AI詞典筆T20 英偉達(dá)AI芯片 AI助手 AIOps

上一篇

大佬談AI｜李彥宏、周鴻祎強調(diào)大模型應(yīng)用黃仁勛、奧特曼暢想5年實現(xiàn)AGI 馬斯克擔(dān)心電力不夠

下一篇

節(jié)約的紙張相當(dāng)于保護(hù)了700萬棵樹！掃描全能王AI助力“指尖上”的減碳

簡版
原版
投稿
回頂部

2024-03-12

參照人類大腦，學(xué)會忘記會讓AI大模型變得更好？

計算機科學(xué)家團(tuán)隊近期開發(fā)出一種更敏捷更具彈性的機器學(xué)習(xí)模型，它們可以周期性忘記已知信息，而現(xiàn)有大語言模型不具備忘卻能力。

長按掃碼閱讀全文

^{<span id="uanav"><noframes id="uanav">}