撰文 | 李信馬
編輯 | 楊博丞
題圖 | IC Photo
時隔近一個月之后,零一萬物再次發(fā)聲。
此前,由李開復創(chuàng)辦的AI獨角獸零一萬物,在11月6日正式發(fā)布了首款開源中英雙語大模型——Yi。
不過在原阿里技術副總裁、深度學習框架Caffe發(fā)明者賈揚清暗指某國內大廠新模型套殼LLaMA架構后,零一萬物受到波及,陷入了“套殼”風波。LLaMA是Meta創(chuàng)建的大語言模型,在今年7月發(fā)布并完全開源。曾有開發(fā)者表示,除了兩個張量被重命名外,Yi完全使用了LLaMA的架構 。
面對質疑,在11月15日,零一萬物官微發(fā)布了《零一萬物對 Yi-34B 訓練過程的說明》,其中提到“大模型持續(xù)發(fā)展與尋求突破口的核心點不僅在于架構,而是在于訓練得到的參數(shù)”。零一萬物在訓練模型過程中,沿用了GPT/LLaMA的基本架構,得以快速起步,對開發(fā)者也更友好。Yi-34B和Yi-6B模型則是零一萬物從0開始訓練的,并做了大量原創(chuàng)性的優(yōu)化和突破工作。
至于沿用LLaMA部分推理代碼經實驗更名后的疏忽,原始出發(fā)點是為了充分測試模型,執(zhí)行對比實驗,對部分推理參數(shù)進行了重新命名,并非為了刻意隱瞞。
圖片來源:零一萬物
今日,零一萬物對表示,公司內部經過幾個周的國際國內法律研判,已經確認完全不涉及套殼、抄襲,并給出了進一步的澄清。
Eric Hartford就是本次風波的起點之一,在Yi-34B開源發(fā)布后,他向官方發(fā)出郵件:“感謝你們提供了一個優(yōu)秀的模型。Yi模型使用了與LLaMA模型完全相同的架構,只是將兩個張量改了名字。由于圍繞LLaMA架構有很多投資和工具,保持張量名稱的一致性是有價值的。”
之后,零一萬物接受了Eric建議,很快在各開源平臺重新提交模型及代碼,完成了開源社區(qū)的版本更新。雖然依舊在國內引起了風波,但Eric卻自發(fā)且不遺余力為Yi辯護,并在X(twitter)上寫道:“他們沒有在任何事情上撒謊。所有的模型都是在相互借鑒架構。架構是學術研究的產物,已經發(fā)表在論文中,任何人都可以自由使用,這絲毫不減損Yi團隊的成就。他們從零開始使用自己創(chuàng)建的數(shù)據(jù)集訓練Yi,對開源領域的貢獻是值得贊揚的?!?/p>
圖片來源:X
值得一提的是,選擇在一個月后再次發(fā)聲,還有一個原因是,近期零一萬物在多個榜單上憑實力 “揚眉吐氣”。
11月24日,Yi-34B-Chat微調模型開源上線,在斯坦福大學研發(fā)的大語言模型評測 AlpacaEval Leaderboard 中,Yi-34B-Chat以94.08%的勝率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT,成為經由Alpaca官方認證的,全球僅次GPT-4英語能力的大語言模型。
AlpacaEval Leaderboard排行榜(發(fā)布于2023年12月7日)
圖片來源:零一萬物
在加州大學伯克利分校主導的LMSYS ORG排行榜中,Yi-34B-Chat也以1102的Elo評分,晉升最新開源SOTA開源模型之列,性能表現(xiàn)追平GPT-3.5。而且,伯克利LMSYS ORG排行榜采用的是接近用戶體感的“聊天機器人競技場”特殊測評模式,讓眾多大語言模型在評測平臺隨機進行比試,通過眾籌真實用戶來進行線上實時盲測和匿名投票。LMSYS ORG 在12月8日官宣11月份總排行時評價:“Yi-34B-Chat 和 Tulu-2-DPO-70B 在開源界的進擊表現(xiàn)已經追平 GPT-3.5”。
LMSYS ORG榜單(發(fā)布于2023年12月8日)
圖片來源:零一萬物
在中文能力方面,11月底發(fā)布的《SuperCLUE中文大模型基準評測報告 2023》中 ,Yi-34B Chat迅速晉升到“卓越領導者”象限,在“SuperCLUE 大模型對戰(zhàn)勝率” 這項關鍵指標上,Yi-34B-Chat 取得31.82%的勝率,僅次于GPT4-Turbo。
中文SuperCLUE排行榜(發(fā)布于2023年11月28日)
圖片來源:零一萬物
目前,Yi模型在Hugging Face社區(qū)下載量為16.8萬,魔搭社區(qū)下載量1.2萬。在GitHub 獲得超過4900個Stars。多家知名公司和機構也推出了基于Yi模型基座的微調模型,比如獵豹旗下的獵戶星空公司推出的OrionStar-Yi-34B-Chat模型,南方科技大學和粵港澳大灣區(qū)數(shù)字經濟研究院認知計算與自然語言研究中心聯(lián)合發(fā)布的SUS-Chat-34B等,AMD和Hugging Face合作的GPU加速大模型的實驗中,也選擇了Yi-6B作為范例項目。
知名技術寫作者蘇洋表示,在他觀察的近期Hugging Face榜單中,前三十名有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據(jù)榜單頭部的68B和70B模型的數(shù)量目前只留有幾個,“從這點看 Yi 對于開源生態(tài)的幫助還是非常巨大的?!?/p>
隨著新成就的不斷取得,和更多開發(fā)者與權威機構的認可,外界對零一萬物的質疑,想必也會逐漸平息。除了表現(xiàn)出的硬實力外,也期待,零一萬物能在應用落地方面,創(chuàng)造出更多的價值。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長:總收入70.2億元,付費用戶數(shù)1.19億
- 蘋果Q4營收949億美元同比增6%,在華營收微降
- 三星電子Q3營收79萬億韓元,營業(yè)利潤受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權
- 格力電器三季度營收同比降超15%,凈利潤逆勢增長
- 合合信息2024年前三季度業(yè)績穩(wěn)?。籂I收增長超21%,凈利潤增長超11%
- 臺積電四季度營收有望再攀高峰,預計超260億美元刷新紀錄
- 韓國三星電子決定退出LED業(yè)務,市值蒸發(fā)超4600億元
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。