通義千問開源!8月3日,AI模型社區(qū)魔搭ModelScope上架兩款開源模型Qwen-7B和Qwen-7B-Chat,阿里云確認(rèn)其為通義千問70億參數(shù)通用模型和對話模型,兩款模型均開源、免費(fèi)、可商用。在多個權(quán)威測評中,通義千問7B模型取得了遠(yuǎn)超國內(nèi)外同等尺寸模型的效果,成為當(dāng)下業(yè)界最強(qiáng)的中英文7B開源模型。
今年4月,阿里云推出自研大模型通義千問,引發(fā)井噴式的市場需求。此次小型化模型版本開源,有望抹平模型使用門檻,讓海量中小企業(yè)和AI開發(fā)者更早、更快地用上通義千問。這一舉動也讓阿里云成為國內(nèi)首個加入大模型開源行列的大型科技企業(yè)。
Qwen-7B是支持中、英等多種語言的基座模型,在超過2萬億token數(shù)據(jù)集上訓(xùn)練,上下文窗口長度達(dá)到8k。Qwen-7B-Chat是基于基座模型的中英文對話模型,已實(shí)現(xiàn)與人類認(rèn)知對齊。開源代碼支持對Qwen-7B和Qwen-7B-Chat的量化,支持用戶在消費(fèi)級顯卡上部署和運(yùn)行模型。
用戶既可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺訪問和調(diào)用Qwen-7B和Qwen-7B-Chat,阿里云為用戶提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的全方位服務(wù)。
通義千問7B預(yù)訓(xùn)練模型在多個權(quán)威基準(zhǔn)測評中表現(xiàn)出色,中英文能力遠(yuǎn)超國內(nèi)外同等規(guī)模開源模型,部分能力甚至“躍級”趕超12B、13B尺寸開源模型。
在英文能力測評基準(zhǔn)MMLU上,通義千問7B模型得分超過一眾7B、12B、13B主流開源模型。該基準(zhǔn)包含57個學(xué)科的英文題目,考驗(yàn)人文、社科、理工等領(lǐng)域的綜合知識和問題解決能力。
在中文常識能力測評基準(zhǔn)C-Eval上,通義千問在驗(yàn)證集和測試集中都是得分最高的7B開源模型,展現(xiàn)了扎實(shí)的中文能力。相比英文世界熱鬧的AI開源生態(tài),中文社區(qū)缺少優(yōu)秀的基座模型。通義千問的加入有望為開源社區(qū)提供更多選擇,推動中國AI開源生態(tài)建設(shè)。
在數(shù)學(xué)解題能力評測GSM8K、代碼能力評測HumanEval等基準(zhǔn)上,通義千問7B模型也有不俗表現(xiàn),勝過所有同等尺寸開源模型和和部分大尺寸開源模型。
阿里云表示,開源大模型可以幫助用戶簡化模型訓(xùn)練和部署的過程,用戶不必從頭訓(xùn)練模型,只需下載預(yù)訓(xùn)練好的模型并進(jìn)行微調(diào),就可快速構(gòu)建高質(zhì)量的模型。
開源生態(tài)對促進(jìn)中國大模型的技術(shù)進(jìn)步與應(yīng)用落地至關(guān)重要。今年7月,阿里云宣布將促進(jìn)中國大模型生態(tài)的繁榮作為首要目標(biāo),向大模型創(chuàng)業(yè)公司提供智能算力、開發(fā)工具等全方位服務(wù)。2022年阿里云牽頭發(fā)起AI模型社區(qū)魔搭,以AI模型為核心服務(wù)AI開發(fā)者。目前,魔搭聚集了20多家頂尖人工智能機(jī)構(gòu)貢獻(xiàn)的1000多款開源模型,已經(jīng)成為中國大模型開源第一門戶。
附:開源地址
魔搭ModelScope:
https://modelscope.cn/models/qwen/Qwen-7B/summary
https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary
Hugging Face:https://huggingface.co/Qwen
GitHub:https://github.com/QwenLM/Qwen-7B
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )