精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

阿里云通義開源推理大模型QwQ，推理水平比肩OpenAI o1

人閱讀
2024-11-28 15:56:09
來源：極客網(wǎng)
相關(guān)關(guān)鍵詞

11月28日，阿里云通義團隊發(fā)布全新AI推理模型QwQ-32B-Preview，并同步開源。評測數(shù)據(jù)顯示，預(yù)覽版本的QwQ，已展現(xiàn)出研究生水平的科學(xué)推理能力，在數(shù)學(xué)和編程方面表現(xiàn)尤為出色，整體推理水平比肩OpenAI o1。

QwQ（Qwen with Questions）是通義千問Qwen大模型最新推出的實驗性研究模型，也是阿里云首個開源的AI推理模型。阿里云通義千問團隊研究發(fā)現(xiàn)，當(dāng)模型有足夠的時間思考、質(zhì)疑和反思時，其對數(shù)學(xué)和編程的理解就會深化?；诖耍琎wQ取得了解決復(fù)雜問題的突破性進展。

圖片1.jpg

在考察科學(xué)問題解決能力的GPQA評測集上，QwQ獲得65.2%的準確率，具備研究生水平的科學(xué)推理能力；在涵蓋綜合數(shù)學(xué)主題的AIME評測中，QwQ以50%的勝率證明其擁有解決數(shù)學(xué)問題的豐富技能；在全面考察數(shù)學(xué)解題能力的MATH-500評測中，QwQ斬獲90.6%的高分，一舉超越o1-preview和o1-mini；在評估高難度代碼生成的LiveCodeBench評測中，QwQ答對一半的題，在編程競賽題場景中也有出色表現(xiàn)。

面對復(fù)雜問題，QwQ展現(xiàn)了深度自省的能力，會質(zhì)疑自身假設(shè)，進行深思熟慮的自我對話，并仔細審視其推理過程的每一步。比如，在經(jīng)典智力題“猜牌問題”中，QwQ通過梳理各方對話并推演現(xiàn)實情況，像個擅長思考的人一樣，揣摩“這句話有點tricky”，反思“等一下，也許我需要更仔細地思考”，最終分析得出正確答案，讓人驚艷。

目前，QwQ-32B-Preview已在魔搭社區(qū)和HuggingFace等平臺上開源。發(fā)布短短幾小時，引起全球開發(fā)者熱情體驗。有開發(fā)者認為該模型“是完全沒有預(yù)料到的瘋狂的躍進”、“今年開源領(lǐng)域最重大的突破”、“讓中國在開源大模型和AI推理上占據(jù)先機”。通義團隊透露，盡管QwQ展現(xiàn)了強大的分析能力，但該模型仍是個供研究的實驗型模型，存在不同語言的混合使用、偶有不恰當(dāng)偏見、對專業(yè)領(lǐng)域問題不了解等局限。隨著研究深入模型迭代，這些問題將逐步得到解決。

附：

Modelscope開源地址：https://modelscope.cn/models/Qwen/QwQ-32B-Preview

Modelscope創(chuàng)空間體驗：https://modelscope.cn/studios/Qwen/QwQ-32B-preview

HuggingFace開源地址：https://huggingface.co/Qwen/QwQ-32B-Preview

HuggingFace Space體驗：https://huggingface.co/spaces/Qwen/QwQ-32B-preview

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

為您推薦

極客觀察

欄目相關(guān)

贊助商

極客網(wǎng)熱搜關(guān)鍵詞

人工智能 AI OpenAI 機器學(xué)習(xí) ChatGPT 生成式AI AI芯片 AIGC U-Mail 世界人工智能大會 AI大模型 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術(shù) 蘋果AI 谷歌AI GenAI 科大訊飛AI學(xué)習(xí)機百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機華為AI 松鼠AI 微軟AI AI+ AIS Airdoc WAIC 昇騰AI創(chuàng)新大賽 AITO 阿爾法蛋AI詞典筆京東AI 智譜AI AI模型 SoleusAir aigo SoleusAir舒樂氏 2019世界人工智能大會 LIFAair AI機器人 AI創(chuàng)企移動AI時代人工智能大會浙大AIF Zain 人工智能技術(shù) AI應(yīng)用 AI醫(yī)療 AI算力人工智能芯片 AI人才 xAI Airtag AI時代騰訊AI AI服務(wù)器 AI算法 AI框架 BrainCo AI投資 Gmail 人工智能計算中心聯(lián)想AI VAIO 人工智能大賽 AI教育 Chain Coremail OPENAIGC開發(fā)者大賽 AI賦能谷歌人工智能 Airwheel AI搜索人工智能名片昇騰AI開發(fā)者創(chuàng)享日 Mirai AI聊天機器人 AI音樂 Airwallex空中云匯 BrainCo強腦科技 AI原生應(yīng)用百度人工智能 AI計算阿爾法蛋AI詞典筆T20 AIOps 阿里AI 英偉達AI芯片 AI基礎(chǔ)設(shè)施蘋果人工智能人工智能+

上一篇

馬斯克旗下xAI蓄勢待發(fā)，擬推獨立App正面挑戰(zhàn)ChatGPT

下一篇

未來6年，云計算對全球GDP的貢獻預(yù)計將超過12萬億美元

簡版
原版
投稿
回頂部

2024-11-28

阿里云通義開源推理大模型QwQ，推理水平比肩OpenAI o1

11月28日，阿里云通義團隊發(fā)布全新AI推理模型QwQ-32B-Preview，并同步開源。評測數(shù)據(jù)顯示，預(yù)覽版本的QwQ，已展現(xiàn)出研究生水平的科學(xué)推理能力，在數(shù)學(xué)和編程方面表現(xiàn)尤為出色，整體推理水平比肩OpenAI o1。

長按掃碼閱讀全文