精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<source id="2kgkg"><ul id="2kgkg"></ul></source>

<source id="2kgkg"></source>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

阿里通義Qwen2成斯坦福大模型榜單最強開源模型

人閱讀
2024-06-20 10:56:24
來源：極客網(wǎng)
相關關鍵詞
- 阿里通義
- 大模型

6月20日消息，斯坦福大學的大模型測評榜單HELM MMLU發(fā)布最新結果，斯坦福大學基礎模型研究中心主任Percy Liang發(fā)文表示，阿里通義千問Qwen2-72B模型成為排名最高的開源大模型，性能超越Llama3-70B模型。

MMLU（Massive Multitask Language Understanding，大規(guī)模多任務語言理解）是業(yè)界最有影響力的大模型測評基準之一，涵蓋了基礎數(shù)學、計算機科學、法律、歷史等57項任務，用以測試大模型的世界知識和問題解決能力。但在現(xiàn)實測評中，不同參評模型的測評結果有時缺乏一致性、可比性，原因包括使用非標準提示詞技術、沒有統(tǒng)一采用開源評價框架等等。

斯坦福大學基礎模型研究中心（CRFM，Center for Research on Foundation Models）提出的基礎模型評估框架HELM（A holistic framework for evaluating foundation models），旨在創(chuàng)造一種透明、可復現(xiàn)的評估方法。該方法基于HELM框架，對不同模型在MMLU上的評估結果進行標準化和透明化處理，從而克服現(xiàn)有MMLU評估中存在的問題。比如，針對所有參評模型，都采用相同的提示詞；針對每項測試主題，都給模型提供同樣的5個示例進行情境學習，等等。

日前，斯坦福大學基礎模型研究中心主任Percy Liang在社交平臺發(fā)布了HELM MMLU最新榜單，阿里巴巴的通義千問開源模型Qwen2-72B排名第5，僅次于Claude 3 Opus、GPT-4o、Gemini 1.5 pro、GPT-4，是排名第一的開源大模型，也是排名最高的中國大模型。

據(jù)悉，通義千問Qwen2于6月初開源，包含5個尺寸的預訓練和指令微調(diào)模型，目前Qwen系列模型下載量已經(jīng)突破1600萬。

（免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內(nèi)容或斷開相關鏈接。）

為您推薦

極客觀察

欄目相關

贊助商

極客網(wǎng)熱搜關鍵詞

人工智能 AI OpenAI 機器學習 ChatGPT 生成式AI AI芯片 AIGC U-Mail 世界人工智能大會 AI大模型 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術蘋果AI 谷歌AI GenAI 科大訊飛AI學習機百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機華為AI 松鼠AI 微軟AI AI+ AIS Airdoc WAIC 昇騰AI創(chuàng)新大賽 AITO 阿爾法蛋AI詞典筆京東AI 智譜AI AI模型 SoleusAir aigo SoleusAir舒樂氏 2019世界人工智能大會 LIFAair AI機器人 AI創(chuàng)企移動AI時代人工智能大會浙大AIF Zain 人工智能技術 AI應用 AI醫(yī)療 AI算力人工智能芯片 AI人才 xAI Airtag AI時代騰訊AI AI服務器 AI算法 AI框架 BrainCo AI投資 Gmail 人工智能計算中心聯(lián)想AI VAIO 人工智能大賽 AI教育 Chain Coremail OPENAIGC開發(fā)者大賽 AI賦能谷歌人工智能 Airwheel AI搜索人工智能名片昇騰AI開發(fā)者創(chuàng)享日 Mirai AI聊天機器人 AI音樂 Airwallex空中云匯 BrainCo強腦科技 AI原生應用百度人工智能 AI計算阿爾法蛋AI詞典筆T20 AIOps 阿里AI 英偉達AI芯片 AI基礎設施蘋果人工智能人工智能+

上一篇

除AI芯片外，AI工廠也是英偉達市值登頂全球的“殺手锏”

下一篇

OpenAI“宮斗”關鍵人物離職一個月后官宣創(chuàng)業(yè) 還拉來了蘋果前AI高管

簡版
原版
投稿
回頂部

2024-06-20

阿里通義Qwen2成斯坦福大模型榜單最強開源模型

斯坦福大學的大模型測評榜單HELM MMLU發(fā)布最新結果，斯坦福大學基礎模型研究中心主任Percy Liang發(fā)文表示，阿里通義千問Qwen2-72B模型成為排名最高的開源大模型，性能超越Llama3-70B模型。

長按掃碼閱讀全文

<option id="maqao"></option>

<option id="maqao"><tbody id="maqao"></tbody></option>

<tbody id="maqao"><cite id="maqao"></cite></tbody>