零一萬物最新發(fā)聲：不涉及套殼、抄襲，權威榜單排名直追GPT-4

撰文 | 李信馬

編輯 | 楊博丞

題圖 | IC Photo

時隔近一個月之后，零一萬物再次發(fā)聲。

此前，由李開復創(chuàng)辦的AI獨角獸零一萬物，在11月6日正式發(fā)布了首款開源中英雙語大模型——Yi。

不過在原阿里技術副總裁、深度學習框架Caffe發(fā)明者賈揚清暗指某國內大廠新模型套殼LLaMA架構后，零一萬物受到波及，陷入了“套殼”風波。LLaMA是Meta創(chuàng)建的大語言模型，在今年7月發(fā)布并完全開源。曾有開發(fā)者表示，除了兩個張量被重命名外，Yi完全使用了LLaMA的架構。

面對質疑，在11月15日，零一萬物官微發(fā)布了《零一萬物對 Yi-34B 訓練過程的說明》，其中提到“大模型持續(xù)發(fā)展與尋求突破口的核心點不僅在于架構，而是在于訓練得到的參數(shù)”。零一萬物在訓練模型過程中，沿用了GPT/LLaMA的基本架構，得以快速起步，對開發(fā)者也更友好。Yi-34B和Yi-6B模型則是零一萬物從0開始訓練的，并做了大量原創(chuàng)性的優(yōu)化和突破工作。

至于沿用LLaMA部分推理代碼經實驗更名后的疏忽，原始出發(fā)點是為了充分測試模型，執(zhí)行對比實驗，對部分推理參數(shù)進行了重新命名，并非為了刻意隱瞞。

圖片來源：零一萬物

今日，零一萬物對表示，公司內部經過幾個周的國際國內法律研判，已經確認完全不涉及套殼、抄襲，并給出了進一步的澄清。

Eric Hartford就是本次風波的起點之一，在Yi-34B開源發(fā)布后，他向官方發(fā)出郵件：“感謝你們提供了一個優(yōu)秀的模型。Yi模型使用了與LLaMA模型完全相同的架構，只是將兩個張量改了名字。由于圍繞LLaMA架構有很多投資和工具，保持張量名稱的一致性是有價值的。”

之后，零一萬物接受了Eric建議，很快在各開源平臺重新提交模型及代碼，完成了開源社區(qū)的版本更新。雖然依舊在國內引起了風波，但Eric卻自發(fā)且不遺余力為Yi辯護，并在X（twitter）上寫道：“他們沒有在任何事情上撒謊。所有的模型都是在相互借鑒架構。架構是學術研究的產物，已經發(fā)表在論文中，任何人都可以自由使用，這絲毫不減損Yi團隊的成就。他們從零開始使用自己創(chuàng)建的數(shù)據(jù)集訓練Yi，對開源領域的貢獻是值得贊揚的?！?/p>

圖片來源：X

值得一提的是，選擇在一個月后再次發(fā)聲，還有一個原因是，近期零一萬物在多個榜單上憑實力 “揚眉吐氣”。

11月24日，Yi-34B-Chat微調模型開源上線，在斯坦福大學研發(fā)的大語言模型評測 AlpacaEval Leaderboard 中，Yi-34B-Chat以94.08%的勝率，超越LLaMA2 Chat 70B、Claude 2、ChatGPT，成為經由Alpaca官方認證的，全球僅次GPT-4英語能力的大語言模型。

AlpacaEval Leaderboard排行榜（發(fā)布于2023年12月7日）

圖片來源：零一萬物

在加州大學伯克利分校主導的LMSYS ORG排行榜中，Yi-34B-Chat也以1102的Elo評分，晉升最新開源SOTA開源模型之列，性能表現(xiàn)追平GPT-3.5。而且，伯克利LMSYS ORG排行榜采用的是接近用戶體感的“聊天機器人競技場”特殊測評模式，讓眾多大語言模型在評測平臺隨機進行比試，通過眾籌真實用戶來進行線上實時盲測和匿名投票。LMSYS ORG 在12月8日官宣11月份總排行時評價：“Yi-34B-Chat 和 Tulu-2-DPO-70B 在開源界的進擊表現(xiàn)已經追平 GPT-3.5”。

LMSYS ORG榜單（發(fā)布于2023年12月8日）

圖片來源：零一萬物

在中文能力方面，11月底發(fā)布的《SuperCLUE中文大模型基準評測報告 2023》中，Yi-34B Chat迅速晉升到“卓越領導者”象限，在“SuperCLUE 大模型對戰(zhàn)勝率” 這項關鍵指標上，Yi-34B-Chat 取得31.82%的勝率，僅次于GPT4-Turbo。

中文SuperCLUE排行榜（發(fā)布于2023年11月28日）

圖片來源：零一萬物

目前，Yi模型在Hugging Face社區(qū)下載量為16.8萬，魔搭社區(qū)下載量1.2萬。在GitHub 獲得超過4900個Stars。多家知名公司和機構也推出了基于Yi模型基座的微調模型，比如獵豹旗下的獵戶星空公司推出的OrionStar-Yi-34B-Chat模型，南方科技大學和粵港澳大灣區(qū)數(shù)字經濟研究院認知計算與自然語言研究中心聯(lián)合發(fā)布的SUS-Chat-34B等，AMD和Hugging Face合作的GPU加速大模型的實驗中，也選擇了Yi-6B作為范例項目。

知名技術寫作者蘇洋表示，在他觀察的近期Hugging Face榜單中，前三十名有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型，原本占據(jù)榜單頭部的68B和70B模型的數(shù)量目前只留有幾個，“從這點看 Yi 對于開源生態(tài)的幫助還是非常巨大的?！?/p>

隨著新成就的不斷取得，和更多開發(fā)者與權威機構的認可，外界對零一萬物的質疑，想必也會逐漸平息。除了表現(xiàn)出的硬實力外，也期待，零一萬物能在應用落地方面，創(chuàng)造出更多的價值。

免責聲明：本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內容或斷開相關鏈接。

精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

零一萬物最新發(fā)聲：不涉及套殼、抄襲，權威榜單排名直追GPT-4

下一篇

精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

零一萬物最新發(fā)聲：不涉及套殼、抄襲，權威榜單排名直追GPT-4

下一篇

零一萬物最新發(fā)聲：不涉及套殼、抄襲，權威榜單排名直追GPT-4