在電視和電影的拍攝中,演員在表演中經(jīng)常會不小心犯下一些小錯誤。對于影片的剪輯師而言,如果不想要花費巨資重新拍攝,那么就只能接受這些瑕疵。
那么我們可以想象一下,剪輯師是否能通過文字劇本來重新修改視頻。這個過程簡單地就像平時處理word文檔那樣,添加你想要的內(nèi)容,刪除多余的內(nèi)容,甚至完全重新排列拍攝的影片,讓它看起來就像一個全新的視頻那樣,毫無瑕疵。
一批來自斯坦福大學、馬克斯普朗克信息學研究所、普林斯頓大學和Adobe Research的研究人員組織了一個團隊,他們創(chuàng)建了一種算法,它能編輯頭部特寫的對話視頻——即視頻中的講話人主要出現(xiàn)肩膀以上的部分。
對于視頻剪輯師和發(fā)行商而言,這個研究成果會非常有用。但也有人擔心這種工具會影響網(wǎng)上視頻和圖片的可信性。研究人員也針對這些工具提出了一些使用準則,提示觀看者這些視頻受到過修改。
“不幸的是,這種技術(shù)永遠會招來不法分子的注意。盡管如此,它能帶來更多創(chuàng)造性的視頻編輯和內(nèi)容創(chuàng)作應用,因此也是值得的。”斯坦福大學博士后Ohad Fried說道。
這種應用通過全新的腳本從各種視頻片段中提取講話時的唇部動作,并采用機器學習將它“移植”到目標視頻中,讓觀眾看起來更自然。換句話說,它就是讓“唇部運動”和文本同步。
“從表面上看,這些視頻非常完美,它不再需要重新錄制。”Fried說道,他以第一作者的身份發(fā)表了一篇相關(guān)研究的論文,目前該論文已經(jīng)上傳至論文預印本網(wǎng)站arXiv上。該項目始于兩年前,當時Fried還只是普林斯頓大學計算機科學家Adam Finkelstein手下的一名研究生。
一旦演員在表演時講錯了臺詞,剪輯師只需要重新修改一下劇本臺詞,這個應用會自動找到視頻中對應的片段,并搜索該視頻中其他的臺詞,重新組裝這段語音。換句話說,這就是在重寫視頻的臺詞,就像我們修改文檔中拼錯的單詞那樣。該算法需要原始視頻為素材,修改時間約為40分鐘。
在此之后,這個算法會從其他視頻中尋找人物講話時的嘴部動作,生成新的視頻。
為了讓視頻看起來更加自然,該算法還能讓運動參數(shù)的變化更加平滑,并進行3D動畫渲染。最后,它會通過一種名為Neural Rendering的機器學習技術(shù)提高視頻的仿真度。
在138位參與者的測試里,該團隊的編輯結(jié)果中有60%被評為“逼真”。也就是說加工后的視頻和原始視頻非常像,但Fried表示還有很大的提升空間。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美國ITC裁定聯(lián)想智能手機侵犯愛立信專利
- 英特爾高通隔空叫陣:兩大巨頭在較什么勁?
- IDC最新預測:2024年P(guān)C和平板電腦市場將增長3.8%至4.035億臺
- 蘋果Vision Pro頭顯即將登陸中國臺灣,12月17日正式發(fā)售
- 全球折疊屏手機出貨量首次遭遇季度下滑,三星旗艦機型表現(xiàn)不佳是主因
- HUAWEI Mate X6 震撼登場,折疊引領者,巔峰再跨越
- 五年持續(xù)領跑,華為折疊屏一步領先,一路領先
- 全新HUAWEI MatePad Pro 13.2 英寸首發(fā)亮相,鴻蒙專業(yè)生產(chǎn)力體驗再升級
- 華為凌霄子母路由 Q7 網(wǎng)線版推出,讓每個房間都有滿格信號
- 華為發(fā)布HUAWEI WATCH D2,開啟腕上血壓管理新篇章
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。