精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<dl id="iyqqw"><small id="iyqqw"></small></dl>

<menu id="iyqqw"></menu>

直播
榜單
7x24h快訊

極客網(wǎng) > 互聯(lián)網(wǎng) >

通義千問開源Qwen2.5大模型，性能超越Llama

人閱讀
2024-09-19 14:17:11
來源：TechWeb.com.cn
相關(guān)關(guān)鍵詞

9月19日消息，2024云棲大會上，阿里云CTO周靖人發(fā)布通義千問新一代開源模型Qwen2.5，旗艦?zāi)Ｐ蚎wen2.5-72B性能超越Llama 405B，再登全球開源大模型王座。

Qwen2.5全系列涵蓋多個尺寸的大語言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型，每個尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本，總計上架100多個模型，刷新業(yè)界紀錄。

據(jù)介紹，Qwen2.5全系列模型都在18T tokens數(shù)據(jù)上進行預(yù)訓(xùn)練，相比Qwen2，整體性能提升18%以上，擁有更多的知識、更強的編程和數(shù)學(xué)能力。Qwen2.5-72B模型在MMLU-rudex基準（考察通用知識）、MBPP 基準（考察代碼能力）和MATH基準（考察數(shù)學(xué)能力）的得分高達86.8、88.2、83.1。

Qwen2.5支持高達128K的上下文長度，可生成最多8K內(nèi)容。模型擁有強大的多語言能力，支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 種以上語言。模型能夠絲滑響應(yīng)多樣化的系統(tǒng)提示，實現(xiàn)角色扮演和聊天機器人等任務(wù)。在指令跟隨、理解結(jié)構(gòu)化數(shù)據(jù)（如表格）、生成結(jié)構(gòu)化輸出（尤其是JSON）等方面Qwen2.5都進步明顯。

語言模型方面，Qwen2.5開源了7個尺寸，0.5B、1.5B、3B、7B、14B、32B、72B，它們在同等參數(shù)賽道都創(chuàng)造了業(yè)界最佳成績，型號設(shè)定充分考慮下游場景的不同需求，3B是適配手機等端側(cè)設(shè)備的黃金尺寸；32B是最受開發(fā)者期待的“性價比之王”，可在性能和功耗之間獲得最佳平衡，Qwen2.5-32B的整體表現(xiàn)超越了Qwen2-72B。

在MMLU-redux等十多個基準測評中，Qwen2.5-72B表現(xiàn)超越Llama3.1-405B

72B是Qwen2.5系列的旗艦?zāi)Ｐ?，其指令跟隨版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等權(quán)威測評中表現(xiàn)出色，在多個核心任務(wù)上，以不到1/5的參數(shù)超越了擁有4050億巨量參數(shù)的Llama3.1-405B，繼續(xù)穩(wěn)居“全球最強開源大模型”的位置。

專項模型方面，用于編程的 Qwen2.5-Coder 和用于數(shù)學(xué)的 Qwen2.5-Math都比前代有了實質(zhì)性進步。Qwen2.5-Coder 在多達5.5T tokens 的編程相關(guān)數(shù)據(jù)上作了訓(xùn)練，當天開源1.5B和7B版本，未來還將開源32B版本；Qwen2.5-Math支持使用思維鏈和工具集成推理（TIR）解決中英雙語的數(shù)學(xué)題，是迄今為止最先進的開源數(shù)學(xué)模型系列，本次開源了1.5B、7B、72B三個尺寸和一款數(shù)學(xué)獎勵模型Qwen2.5-Math-RM。

多模態(tài)模型方面，廣受期待的視覺語言模型Qwen2-VL-72B正式開源，Qwen2-VL能識別不同分辨率和長寬比的圖片，理解20分鐘以上長視頻，具備自主操作手機和機器人的視覺智能體能力。日前權(quán)威測評LMSYS Chatbot Arena Leaderboard發(fā)布最新一期的視覺模型性能測評結(jié)果,Qwen2-VL-72B成為全球得分最高的開源模型。

Qwen2-VL-72B在權(quán)威測評LMSYS Chatbot Arena Leaderboard成為成為全球得分最高的開源視覺理解模型

自從2023年8月開源以來，通義在全球開源大模型領(lǐng)域后來居上，成為開發(fā)者尤其是中國開發(fā)者的首選模型。性能上，通義大模型日拱一卒，逐步趕超美國最強開源模型Llama，多次登頂Hugging Face全球大模型榜單；生態(tài)上，通義從零起步、開疆拓土，與海內(nèi)外的開源社區(qū)、生態(tài)伙伴、開發(fā)者共建生態(tài)網(wǎng)絡(luò)，截至2024年9月中旬，通義千問開源模型下載量突破4000萬，Qwen系列衍生模型總數(shù)超過5萬個，成為僅次于Llama的世界級模型群。

HuggingFace數(shù)據(jù)顯示，截至9月中旬Qwen系列原生模型和衍生模型總數(shù)超過5萬個

極客網(wǎng)企業(yè)會員

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

下一篇

阿斯麥訂單“腰斬”股價暴跌16%，半導(dǎo)體產(chǎn)業(yè)寒冬來了？

阿斯麥訂單腰斬阿斯麥訂單阿斯麥股價暴跌

極客觀察

專題報道

企業(yè)專欄

簡版
原版
投稿
回頂部

2024-09-19

通義千問開源Qwen2.5大模型，性能超越Llama

2024云棲大會上，阿里云CTO周靖人發(fā)布通義千問新一代開源模型Qwen2.5，旗艦?zāi)Ｐ蚎wen2.5-72B性能超越Llama 405B，再登全球開源大模型王座。據(jù)介紹，Qwen2.5全系列模型都在18T tokens數(shù)據(jù)上進行預(yù)訓(xùn)練，相比Qwen2，整體性能提升18%以上，擁有更多的知識、更強的編程和數(shù)學(xué)能力。Qwen2.5支持高達128K的上下文長度，可生成最多8K內(nèi)容。HuggingFace數(shù)據(jù)顯示，截至9月中旬Qwen系列原生模型和衍生模型總數(shù)超過5萬個

長按掃碼閱讀全文

<pre id="s0cso"></pre><optgroup id="s0cso"></optgroup>

<kbd id="s0cso"><nav id="s0cso"></nav></kbd>

<ul id="s0cso"></ul>

<option id="s0cso"></option>

<fieldset id="s0cso"></fieldset>

<source id="s0cso"><tfoot id="s0cso"></tfoot></source>