8月12日消息,今年2月OpenAI發(fā)布文生視頻模型Sora,其逼真而富有想象力的視頻生成能力給大家?guī)?a href="http://worldfootballweekly.com/AI_1.html" target="_blank" class="keylink">AI震撼。Sora雖然能生成60s視頻,但是并未對外開放使用,被視頻業(yè)者戲稱為“期貨”。
國內AI生視頻的產品研發(fā)腳步也加快了,7月快手團隊的AI生視頻產品“可靈” 網頁端正式上線 , 8月字節(jié)跳動旗下的“即夢AI”網頁、App也開放使用。這兩款產品都能實現“文生視頻”和“圖生視頻”,都免費開放給用戶使用,可謂是真正的“現貨”了。
作為國內短視頻領域的兩家頭部企業(yè),他們推出的AI生視頻工具表現如何呢?我們小小試用比較了一下,大家可以看看兩者的效果,你更喜歡哪一款。
測試條件:
目前可靈可生成5s、10s視頻,但是文生視頻“高性能模式”下不支持生成10s視頻;
即夢AI可生成3s、6s、9s、12s視頻。
因此,我們選擇了默認設置下,可靈(5s)和即夢AI(6s)圖生視頻和文生視頻生成的效果進行比較。
一、圖生視頻
從動物、風景、人物圖片來測試比較。
第一個
使用一張含有“熊貓”的照片。
輸入提示詞要求:熊貓頭抬起來,看向我,露出笑容
看看可靈(5s)和即夢AI(6s)的生成結果表現。
點擊圖片跳轉視頻
視頻結果比較:
可靈比較尷尬的是,沒分清楚圖片中大熊貓的頭(朝下)和尾(在上面),直接把大熊貓的屁股給弄成頭轉向“我們”了。
即夢AI雖然分清楚了大熊貓頭尾,但是嚴重失真,出現了6條腿的熊貓,而且在扭動身體時,熊貓身體甚至感覺要斷掉了……
整體效果來看,除去頭1s的首位倒置,可靈生成的熊貓更逼真、運動效果更連貫。
這一局PK,站可靈(+1分)。
第二個
用一張含有上海東方明珠塔的風景圖。
輸入提示詞要求:東方明珠塔從下往上依次亮起彩燈
看看可靈(5s)和即夢AI(6s)的生成結果表現。
點擊圖片跳轉視頻
視頻結果比較:
即夢AI生成的視頻中,東方明珠塔的燈從上往下亮起,和我們要求的方向相反了,視頻補充了路面上車輛經過的視覺效果;
可靈的亮燈效果更明顯,特別突出了東方明珠塔上2個圓球的燈光視覺效果,運鏡上,我們選擇了隨機運鏡,這個視頻里整個塔都搖動了起來,感覺不太真實。
整體來看,即夢AI生成的視頻更逼真一些。
這局PK站即夢AI(+1分)。
第三
用一張含有人物的圖。
輸入提示詞要求:孩子翻動手中的書,并露出微笑
再看看可靈(5s)和即夢AI(6s)的生成結果表現。
點擊圖片跳轉視頻
視頻結果比較:
即夢AI生成的視頻翻車比較明顯,首先是被翻的書像是憑空多出一本摞在了上面,另外,人物手部變形嚴重。
可靈翻書動作完成更好一些,人物手部也有變形,不過好歹還能分清手指,不至于像即夢AI那么嚴重。
這局PK站可靈(+2分)。
下面,在看看可靈和即夢AI的文生視頻表現。
二、文生視頻
第一個: 采用Sora經典視頻的提示詞,讓可靈和即夢AI各自生成視頻。
輸入提示詞:A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
看看可靈(5s)和即夢AI(6s)的生成結果表現。
點擊圖片跳轉視頻
視頻結果比較:
即夢AI生成的人物行走時腿部姿態(tài)比較別扭,周邊人物的處理更虛化,整體效果更偏動漫視覺效果。
可靈生成的人物行走流暢,周邊出現的人物也更為真實,整體效果更逼真一些。
這局PK站可靈(+3分)。
第二個:
輸入提示詞文本:在桂林山水間,一位俠女乘坐竹筏前行,她穿著紅色的長裙,手拿黑色的佩劍,注視著遠方,陽光灑在水面,波光粼粼,有白云從山頂飄過。
看看可靈(5s)和即夢AI(6s)的生成結果表現。
點擊圖片跳轉視頻
即夢AI生成的視頻很好的理解了“桂林山水”這四個字背后的意思,視頻對喀斯特地貌特征呈現更好。缺憾是“黑色的佩劍”這個表現形式太夸張了,飄來飄去有點兒失真。
可靈生成的視頻“桂林山水”特征不明顯,不過竹筏滑動的效果及水面波動和產生的光影效果更好。
這局PK真是比較糾結,看在“桂林山水”的面子上站即夢AI(+2分)。
最后,總結一下,從上面5五局PK來看,可靈3局勝出比即夢AI。
大家覺得哪個更好呢?
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )