精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<table id="xdicz"></table>

<tfoot id="xdicz"></tfoot>

<video id="xdicz"></video>

<strike id="xdicz"></strike>

直播
榜單
7x24h快訊

極客網 > 人工智能 >

阿里云發(fā)布通義千問2.0，性能超GPT-3.5，加速追趕GPT-4

人閱讀
2023-10-31 15:19:22
來源：極客網
相關關鍵詞

10月31日，阿里云正式發(fā)布千億級參數大模型通義千問2.0。在10個權威測評中，通義千問2.0綜合性能超過GPT-3.5，正在加速追趕GPT-4。當天，通義千問APP在各大手機應用市場正式上線，所有人都可通過APP直接體驗最新模型能力。

過去6個月，通義千問2.0在性能上取得巨大飛躍，相比4月發(fā)布的1.0版本，通義千問2.0在復雜指令理解、文學創(chuàng)作、通用數學、知識記憶、幻覺抵御等能力上均有顯著提升。目前，通義千問的綜合性能已經超過GPT-3.5，加速追趕GPT-4。

通義千問2.0綜合性能超過GPT-3.5，正在加速追趕GPT-4.jpg

圖：通義千問2.0綜合性能超過GPT-3.5，正在加速追趕GPT-4

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10個主流Benchmark測評集上，通義千問2.0的得分整體超越Meta的Llama-2-70B，相比OpenAI的Chat-3.5是九勝一負，相比GPT-4則是四勝六負，與GPT-4的差距進一步縮小。

中英文理解能力是大語言模型的基本功。英語任務方面，通義千問2.0在MMLU基準的得分是82.5，僅次于GPT-4，通過大幅增加參數量，通義千問2.0能更好地理解和處理復雜的語言結構和概念；中文任務方面，通義千問2.0以明顯優(yōu)勢在C-Eval基準獲得最高得分，這是由于模型在訓練中學習了更多中文語料，進一步強化了中文理解和表達能力。

在數學推理、代碼理解等領域，通義千問2.0進步明顯。在推理基準測試GSM8K中，通義千問排名第二，展示了強大的計算和邏輯推理能力；在HumanEval測試中，通義千問得分緊跟GPT-4和GPT-3.5，該測試主要衡量大模型理解和執(zhí)行代碼片段的能力，這一能力是大模型應用于編程輔助、自動代碼修復等場景的基礎。

通義千問2.0發(fā)布.jpg

圖：通義千問2.0發(fā)布

通義千問更成熟了，也更好用了。通義千問2.0在指令遵循、工具使用、精細化創(chuàng)作等方面作了技術優(yōu)化，能夠更好地被下游應用場景集成。通義大模型官網上線了多模態(tài)和插件功能，支持圖片輸入、文檔解析等細分任務。

與此同時，基于通義大模型訓練的8大行業(yè)模型組團上線，他們分別是通義靈碼-智能編碼助手、通義智文-AI閱讀助手、通義聽悟-工作學習AI助手、通義星塵-個性化角色創(chuàng)作平臺、通義點金-智能投研助手、通義曉蜜-智能客服、通義仁心-個人專屬健康助手、通義法睿-AI法律顧問。8大行業(yè)模型面向當下最受歡迎的多個垂直場景，使用領域數據進行專門訓練。用戶可以在官網直接體驗模型功能，開發(fā)者可以通過網頁嵌入、API/SDK調用等方式，將模型能力集成到自己的大模型應用和服務中。

通義大模型家族全面升級，8大行業(yè)模型組團上線.jpg

圖：通義大模型家族全面升級，8大行業(yè)模型組團上線

截至10月，阿里云已與60多個行業(yè)頭部伙伴進行深度合作，推動通義千問在辦公、文旅、電力、政務、醫(yī)保、交通、制造、金融、軟件開發(fā)等領域的落地。

周靖人透露，阿里云計劃近期開源通義千問72B版本，此前，阿里云已先后開源7B和14B版本模型，模型累計下載量超過100萬。阿里云將持續(xù)支持千行百業(yè)的開發(fā)者基于通義千問開源模型進行模型和應用創(chuàng)新。

通義千問72B即將開源.jpg

圖：通義千問72B即將開源

（免責聲明：本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網站出現的信息，均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時，應及時向本網站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內容或斷開相關鏈接。）

為您推薦

一圖讀懂《5G規(guī)?；瘧谩皳P帆”行動升級方案》

5G規(guī)?；瘧脫P帆行動 5G揚帆 5G規(guī)?；瘧?/a> 12-10

極客觀察

欄目相關

贊助商

極客網熱搜關鍵詞

人工智能 AI OpenAI 機器學習 ChatGPT 生成式AI AI芯片 AIGC U-Mail 世界人工智能大會 AI大模型 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術蘋果AI 谷歌AI GenAI 科大訊飛AI學習機百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機華為AI 松鼠AI 微軟AI AI+ AIS Airdoc WAIC 昇騰AI創(chuàng)新大賽 AITO 阿爾法蛋AI詞典筆京東AI 智譜AI AI模型 SoleusAir aigo SoleusAir舒樂氏 2019世界人工智能大會 LIFAair AI機器人 AI創(chuàng)企移動AI時代人工智能大會浙大AIF Zain 人工智能技術 AI應用 AI醫(yī)療 AI算力人工智能芯片 AI人才 xAI Airtag AI時代騰訊AI AI服務器 AI算法 AI框架 BrainCo AI投資 Gmail 人工智能計算中心聯(lián)想AI VAIO 人工智能大賽 AI教育 Chain Coremail OPENAIGC開發(fā)者大賽 AI賦能谷歌人工智能 Airwheel AI搜索人工智能名片昇騰AI開發(fā)者創(chuàng)享日 Mirai AI聊天機器人 AI音樂 Airwallex空中云匯 BrainCo強腦科技 AI原生應用百度人工智能 AI計算阿爾法蛋AI詞典筆T20 AIOps 阿里AI 英偉達AI芯片 AI基礎設施蘋果人工智能人工智能+

上一篇

昆侖萬維宣布開源「天工」Skywork-13B系列大模型 0門檻商用

下一篇

會自動寫代碼的AI大模型來了！阿里云推出智能編碼助手通義靈碼

簡版
原版
投稿
回頂部

2023-10-31

阿里云發(fā)布通義千問2.0，性能超GPT-3.5，加速追趕GPT-4

10月31日，阿里云正式發(fā)布千億級參數大模型通義千問2.0。在10個權威測評中，通義千問2.0綜合性能超過GPT-3.5，正在加速追趕GPT-4。

長按掃碼閱讀全文