2024年5月17日,智源研究院舉辦大模型評測發(fā)布會,推出科學、權威、公正、開放的智源評測體系,發(fā)布并解讀國內外140余個開源和商業(yè)閉源的語言及多模態(tài)大模型全方位能力評測結果。作為一家非營利性科研機構,智源研究院有著行業(yè)內稀缺的中立視角,公正客觀地評價了當下“百花齊放”的大模型陣列。
其中,文生視頻模型評測結果顯示,愛詩科技旗下產(chǎn)品 PixVerse 位列全球TOP3,在國內同類型產(chǎn)品中表現(xiàn)最佳。
智源研究院智能評測組負責人楊熙博士講到:“2024年2月Sora出現(xiàn)后引起了廣泛討論,也對國內文生視頻模型能力提出了挑戰(zhàn)。智源研究院與中國傳媒大學聯(lián)合,基于雙方在大模型評測領域及視頻質量評價領域豐富的科研成果和實踐經(jīng)驗,對20余個文生視頻大模型進行了測試。在提供公開服務的模型中,Runway和愛詩科技的PixVerse處于第一梯隊,水平相當。”
隨后,中國傳媒大學智能媒體計算實驗室負責人史萍教授,對本次文生視頻模型評測體系進行了全面細致的解讀。
本次測評共設圖文一致性、真實性、視頻質量和美學質量4個一級維度和26個細分二級維度,經(jīng)專業(yè)、嚴謹?shù)脑u測流程,得到最終結果:Sora模型目前處于全行業(yè)領先地位,Runway Gen2 和 愛詩科技的 PixVerse 模型整體表現(xiàn)優(yōu)異,具備較強的競爭力。在視頻生成的真實性方面,PixVerse 排名第一。
在由智源研究院副院長林詠華主持的圓桌對話環(huán)節(jié)中,中國信息通信研究院人工智能研究所副所長魏凱表示,本次智源大模型評測結果不僅是科學研究的指南針,也是用戶選型及社會對人工智能認知的標尺,對大模型發(fā)展具有極重要的價值和意義。
愛詩科技創(chuàng)始人&CEO王長虎談到,在大模型評測的歷程中,語言模型曾是焦點所在。如今我們非常高興地看到,智源的評測也高度關注多模態(tài)大模型,尤其是視頻生成大模型,這與行業(yè)發(fā)展趨勢一致。智源本次評測為大模型行業(yè)提供了寶貴的參考,也對所有參與評測的模型,包括我們愛詩,都提出了更高的要求。討論大模型成功與否,應在技術層面之上,更多地關注其對用戶和行業(yè)的實際貢獻,比如是否真正滿足了用戶需求、推動了行業(yè)創(chuàng)新。我們期待與智源及其他行業(yè)伙伴一起,共同促進視頻大模型及應用的持續(xù)發(fā)展和進步。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )