精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<rp id="xy5ja"><dl id="xy5ja"></dl></rp>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

Colossal-AI助力，摩爾線程預(yù)訓(xùn)練語(yǔ)言模型MusaBert榮登CLUE榜單TOP10

人閱讀
2022-12-19 11:38:23
相關(guān)關(guān)鍵詞

摩爾線程聯(lián)合潞晨科技研發(fā)的預(yù)訓(xùn)練語(yǔ)言模型MusaBert（MUSA為摩爾線程提出的通用元計(jì)算架構(gòu)），在12月16日的中文語(yǔ)言理解領(lǐng)域權(quán)威CLUE榜單上進(jìn)入TOP 10，最終以82.889得分在CLUE1.1總排行榜中排名（除人類成績(jī)以外）第9，并在AFQMC任務(wù)中以86.92分取得排名第一的成績(jī)，這意味著摩爾線程AI在語(yǔ)義理解與匹配能力上超越了人類水平。同時(shí)，這也是潞晨科技的AI大模型開(kāi)發(fā)系統(tǒng)Colossal-AI在自然語(yǔ)言處理領(lǐng)域應(yīng)用的重要進(jìn)展。

（2022年12月16日CLUE1.1總排行榜最新成績(jī)）

相較于CLUE總排行榜TOP 10的其他中文預(yù)訓(xùn)練模型，MusaBert僅包含3億參數(shù)量，是前十名中規(guī)模最小的模型，并且為單模型（single model），沒(méi)有進(jìn)行任何集成。此外，摩爾線程基于MusaBert的語(yǔ)義嵌入模型MusaSim在AFQMC任務(wù)上擊敗一眾大規(guī)模模型，取得第一名，不僅為檢索系統(tǒng)、分類對(duì)話等更深度語(yǔ)義理解研究打下堅(jiān)固基石，也證明了摩爾線程在中文自然語(yǔ)言處理領(lǐng)域和低資源大模型訓(xùn)練方面的強(qiáng)大能力。

一直以來(lái)，語(yǔ)義理解都是NLP（自然語(yǔ)言處理）技術(shù)的重要目標(biāo)，通過(guò)一系列AI算法，可將文本解析為結(jié)構(gòu)化的、機(jī)器可讀的意圖與詞槽信息。通常來(lái)說(shuō)，訓(xùn)練數(shù)據(jù)的獲取與處理、模型的迭代和訓(xùn)練等都是NLP技術(shù)的落地難點(diǎn)。MusaBert僅使用了極少的參數(shù)量便取得了比肩甚至超越百億參數(shù)大模型的成績(jī)，主要是得益于多方面獲得的突破性進(jìn)展：

· 技術(shù)層面：摩爾線程擁有“軟硬一體”的技術(shù)能力，使得MusaBert能夠從底到上進(jìn)行優(yōu)化；摩爾線程多功能GPU內(nèi)置AI加速和并行計(jì)算等硬件模塊，能夠提供AI和科學(xué)計(jì)算在內(nèi)的全棧功能，能夠?yàn)锳I推理計(jì)算加速、低資源大模型訓(xùn)練等應(yīng)用場(chǎng)景提供通用、高性價(jià)比、節(jié)能環(huán)保的AI能力。

· 算法層面：MusaBert使用了潞晨科技的AI大模型開(kāi)發(fā)系統(tǒng)Colossal-AI，在上游訓(xùn)練方面，充分發(fā)揮了該系統(tǒng)的易用性及強(qiáng)大的并行訓(xùn)練性能，同時(shí)MusaBert針對(duì)模型數(shù)據(jù)預(yù)處理使用的DataLoader進(jìn)行了優(yōu)化，可以在低資源的條件下快速處理大規(guī)模數(shù)據(jù)；在下游任務(wù)方面，摩爾線程通過(guò)采用合適的優(yōu)化建模、在領(lǐng)域內(nèi)進(jìn)行數(shù)據(jù)增強(qiáng)以及在模型的訓(xùn)練優(yōu)化中采用了先進(jìn)的Adan優(yōu)化器等方式，盡可能發(fā)掘和展現(xiàn)出預(yù)訓(xùn)練語(yǔ)言模型強(qiáng)大的語(yǔ)義理解能力。摩爾線程自研的語(yǔ)義嵌入模型MusaSim以MusaBert為基座模型，使用對(duì)比學(xué)習(xí)方法進(jìn)行訓(xùn)練，并利用了摩爾線程收集的百萬(wàn)對(duì)有監(jiān)督數(shù)據(jù)。得益于MusaBert和高質(zhì)量的數(shù)據(jù)集，MusaSim不僅在語(yǔ)義相似度任務(wù)上超越了眾多更大規(guī)模的模型，在意圖識(shí)別、情緒分析等分類任務(wù)上，也能得到較好的效果。

· 數(shù)據(jù)層面：MusaBert除使用了摩爾線程自身收集的高質(zhì)量語(yǔ)義相似數(shù)據(jù)以外，還使用了200GB悟道開(kāi)源數(shù)據(jù)和80GB的CLUE社區(qū)數(shù)據(jù)，以及浪潮電子信息產(chǎn)業(yè)股份有限公司提供的1T高質(zhì)量數(shù)據(jù)集。大規(guī)模高質(zhì)量的數(shù)據(jù)使得模型在相對(duì)小的規(guī)模下仍然保持了較高的性能。

目前，MusaBert作為基座模型，已經(jīng)應(yīng)用于摩爾線程研發(fā)的智能客服與數(shù)字人等項(xiàng)目，并相繼在下游語(yǔ)義相似度、情緒識(shí)別、閱讀理解、聲韻識(shí)別等領(lǐng)域落地。

為了更進(jìn)一步降低大模型開(kāi)發(fā)和應(yīng)用的門檻，MusaBert代碼現(xiàn)已開(kāi)源到Colossal-AI倉(cāng)庫(kù)(https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/roberta)，使用該腳本，可在短時(shí)間內(nèi)訓(xùn)練出高質(zhì)量的中文Bert模型。包括MusaBert和MusaSim在內(nèi)的一系列高質(zhì)量模型也將在近期開(kāi)源以貢獻(xiàn)中文NLP社區(qū)。此外，經(jīng)摩爾線程與潞晨科技的嚴(yán)格測(cè)試，僅通過(guò)摩爾線程多功能GPU單卡，即可進(jìn)行MusaBert甚至是更大規(guī)模的GPT2的訓(xùn)練，大大降低了預(yù)訓(xùn)練成本，這也為雙方實(shí)現(xiàn)低資源大模型訓(xùn)練的共同愿景，邁出了堅(jiān)實(shí)一步。

作為中文語(yǔ)言理解領(lǐng)域最具權(quán)威性的測(cè)評(píng)基準(zhǔn)之一，CLUE 涵蓋文本相似度、分類、自然語(yǔ)言推理、閱讀理解等眾多語(yǔ)義分析和理解類子任務(wù)，工業(yè)界和學(xué)術(shù)界紛紛用 CLUE 作為預(yù)訓(xùn)練算法能力的驗(yàn)證和衡量標(biāo)準(zhǔn)。此次進(jìn)入CLUE榜單TOP 10，代表了摩爾線程與潞晨科技聯(lián)合研發(fā)團(tuán)隊(duì)在中文預(yù)訓(xùn)練研究領(lǐng)域已達(dá)到業(yè)內(nèi)領(lǐng)先水平。

展望未來(lái)，摩爾線程還將與潞晨科技緊密合作，著手更適當(dāng)規(guī)模的自然語(yǔ)言大模型研究，充分利用上游數(shù)據(jù)，產(chǎn)出能力更強(qiáng)的模型并且開(kāi)源。同時(shí)，保持算法和系統(tǒng)兩個(gè)層面并行，持續(xù)優(yōu)化大模型在摩爾線程多功能GPU上的訓(xùn)練能力，尤其在單張消費(fèi)級(jí)顯卡等低資源場(chǎng)景下的訓(xùn)練能力，可以大大降低使用大模型訓(xùn)練的門檻和成本，進(jìn)一步促進(jìn)AI民主化。

關(guān)于潞晨科技

潞晨科技是一家致力于“解放AI生產(chǎn)力”的全球性公司，核心產(chǎn)品面向大模型時(shí)代的通用深度學(xué)習(xí)系統(tǒng) Colossal-AI，可實(shí)現(xiàn)高效快速部署AI大模型訓(xùn)練和推理，降低AI大模型應(yīng)用成本。自開(kāi)源以來(lái)，Colossal-AI已經(jīng)多次在GitHub熱榜位列世界第一，獲得GitHub Star約七千顆，并成功入選SC、AAAI、PPoPP等國(guó)際AI與HPC頂級(jí)會(huì)議的官方教程。相關(guān)解決方案已成功在自動(dòng)駕駛、云計(jì)算、零售、醫(yī)藥、芯片等行業(yè)知名廠商落地應(yīng)用、廣受好評(píng)。

關(guān)于摩爾線程

摩爾線程智能科技（北京）有限責(zé)任公司是一家以GPU芯片設(shè)計(jì)為主的集成電路高科技公司，專注于研發(fā)設(shè)計(jì)全功能GPU芯片及相關(guān)產(chǎn)品，能夠?yàn)橹袊?guó)科技生態(tài)合作伙伴提供強(qiáng)大的計(jì)算加速能力。公司成立于2020年10月，致力于創(chuàng)新面向元計(jì)算應(yīng)用的新一代GPU，構(gòu)建融合視覺(jué)計(jì)算、3D圖形計(jì)算、科學(xué)計(jì)算及人工智能計(jì)算的綜合計(jì)算平臺(tái)，建立基于云原生GPU計(jì)算的生態(tài)系統(tǒng)，助力驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。）

為您推薦

極客觀察

欄目相關(guān)

贊助商

極客網(wǎng)熱搜關(guān)鍵詞

人工智能 AI OpenAI 機(jī)器學(xué)習(xí) ChatGPT 生成式AI AI芯片 AIGC U-Mail 世界人工智能大會(huì) AI大模型 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術(shù) 蘋果AI 谷歌AI GenAI 科大訊飛AI學(xué)習(xí)機(jī) 百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機(jī) 華為AI 松鼠AI 微軟AI AI+ AIS Airdoc WAIC 昇騰AI創(chuàng)新大賽 AITO 阿爾法蛋AI詞典筆京東AI 智譜AI AI模型 SoleusAir aigo SoleusAir舒樂(lè)氏 2019世界人工智能大會(huì) LIFAair AI機(jī)器人 AI創(chuàng)企移動(dòng)AI時(shí)代人工智能大會(huì) 浙大AIF Zain 人工智能技術(shù) AI應(yīng)用 AI醫(yī)療 AI算力人工智能芯片 AI人才 xAI Airtag AI時(shí)代騰訊AI AI服務(wù)器 AI算法 AI框架 BrainCo AI投資 Gmail 人工智能計(jì)算中心聯(lián)想AI VAIO 人工智能大賽 AI教育 Chain Coremail OPENAIGC開(kāi)發(fā)者大賽 AI賦能谷歌人工智能 Airwheel AI搜索人工智能名片昇騰AI開(kāi)發(fā)者創(chuàng)享日 Mirai AI聊天機(jī)器人 AI音樂(lè) Airwallex空中云匯 BrainCo強(qiáng)腦科技 AI原生應(yīng)用百度人工智能 AI計(jì)算阿爾法蛋AI詞典筆T20 AIOps 阿里AI 英偉達(dá)AI芯片 AI基礎(chǔ)設(shè)施蘋果人工智能人工智能+

上一篇

ChatGPT迅速走紅其開(kāi)發(fā)者OpenAI預(yù)計(jì)2024年?duì)I收達(dá)到10億美元

下一篇

阿里達(dá)摩院獲NeurIPS虛擬電廠競(jìng)賽冠軍 AI減碳超一成

簡(jiǎn)版
原版
投稿
回頂部

2022-12-19

Colossal-AI助力，摩爾線程預(yù)訓(xùn)練語(yǔ)言模型MusaBert榮登CLUE榜單TOP10

摩爾線程聯(lián)合潞晨科技研發(fā)的預(yù)訓(xùn)練語(yǔ)言模型MusaBert（MUSA為摩爾線程提出的通用元計(jì)算架構(gòu)），在12月16日的中文語(yǔ)言理解領(lǐng)域權(quán)威CLUE榜單上進(jìn)入TOP 10，最終以82.889得分在CLUE1.1總排行榜中排名（除人類成績(jī)以外）第9，并在AFQMC任務(wù)中以86.92分取得排名第一的成績(jī)，這意味著摩爾線...

長(zhǎng)按掃碼閱讀全文