近年來,5G通信技術(shù)與AI技術(shù)的發(fā)展將視頻行業(yè)推向了一個新高潮,視頻行業(yè)的發(fā)展也愈發(fā)與人工智能技術(shù)緊密結(jié)合。為此,易有料特別邀請了網(wǎng)易杭州研究院的高級產(chǎn)品經(jīng)理陸徳,在易有料舉辦的“有料小館”沙龍中做了有關(guān)“AI視頻內(nèi)容理解技術(shù)的實踐”的主題分享。作為“有料知識官”,陸徳在演講中圍繞視頻生產(chǎn)、視頻管理、視頻分發(fā)、視頻互動這四個模塊,展示了AI技術(shù)如何賦能內(nèi)容運營、如何助力品牌內(nèi)容營銷數(shù)字化。
視頻內(nèi)容生產(chǎn)實現(xiàn)自動化
在短視頻場景中,橫屏視頻會被調(diào)整成適配手機豎屏的尺寸,傳統(tǒng)方式是通過填充黑邊,但會影響視頻整體美觀度。因此,為滿足用戶的沉浸式內(nèi)容體驗,可以使用目標檢測和鏡頭預測技術(shù)識別視頻主體,保留視頻主體來自動切割豎版視頻。AI內(nèi)容理解技術(shù)還可以用于字幕自動生成環(huán)節(jié),利用該技術(shù)自動生成帶有時間戳的字幕位置,用戶可以在對應的位置上作編輯,還可以一鍵導出字幕文件,方便后續(xù)視頻壓制。
AI技術(shù)應用于視頻內(nèi)容管理
視頻管理最核心的能力是為視頻打標簽,網(wǎng)易杭州研究院的AI視頻標簽體系已經(jīng)支持三級1.2萬+個標簽,包括明星識別、動漫識別、行為動作識別、情緒識別等等,目前也在與易有料一起探索自訓練能力。在音樂播放器邊聽邊看的場景中,要確保字幕跟音樂播放的歌詞相匹配,可以運用圖像領(lǐng)域OCR技術(shù),通過畫面中的圖形識別相應的文字。音頻內(nèi)容理解方面,運用AI技術(shù)對原始音頻進行識別,對說話的對象、語種、聲音事件進行標記,聲音事件主要根據(jù)不同業(yè)務領(lǐng)域進行定制,進一步規(guī)避有風險的內(nèi)容。
視頻內(nèi)容智能推薦與智能檢索
在內(nèi)容社區(qū)推薦場景中,運用AI技術(shù)還可以為大量視頻提供內(nèi)容標簽,擴大視頻個性化推薦內(nèi)容池?;谝曨l指紋技術(shù)實現(xiàn)“以影搜影”與版權(quán)保護,視頻指紋在業(yè)界又被稱為視頻DNA,為每一個視頻抽取唯一的特征進行識別。在海量的視頻中,其中大部分創(chuàng)作者會采用其他來源的素材形成重復性比較高的視頻,因此可以通過視頻指紋技術(shù)去實現(xiàn)視頻的去重和原創(chuàng)保護。視頻指紋同樣可用于視頻檢索,用戶搜視頻一般是通過文字匹配標簽,而使用了該技術(shù),用戶便可以上傳影視片段來搜索出完整的視頻。
直播場景下的AI內(nèi)容理解技術(shù)應用
視頻互動主要發(fā)生在直播場景,目前直播有兩個痛點:實時直播內(nèi)容與封面無關(guān),造成跳出率高;封面無法實時自動更新,會損失一部分的用戶點擊。通過AI技術(shù)來實現(xiàn)“高光封面”,在視頻流和直播流的過程中,通過對視頻、圖像等內(nèi)容的理解,從豐富度、圖像質(zhì)量、精彩程度和吸引程度等多方面進行分析,同時結(jié)合時序和音頻輔助判斷,截取主播當前最精彩片段生成靜態(tài)、動態(tài)封面。
多項AI能力賦能社區(qū)視頻業(yè)務,能為社區(qū)業(yè)務的內(nèi)容流轉(zhuǎn)效率、內(nèi)容分發(fā)效率、內(nèi)容自動化質(zhì)量提升能力帶來可觀的改善,可以更有效降低業(yè)務的人力投入,促進全局資源的優(yōu)化配置。AI視頻內(nèi)容理解技術(shù)大大降低了特定場景中視頻應用的成本,為品牌實現(xiàn)內(nèi)容營銷數(shù)字化起到了推動性作用。
易有料成立于2019年,專注于企業(yè)級內(nèi)容智能運營服務,是國內(nèi)較早提出做企業(yè)級內(nèi)容中臺解決方案的公司。整合全網(wǎng)優(yōu)質(zhì)內(nèi)容及優(yōu)質(zhì)內(nèi)容創(chuàng)作者,通過AI智能技術(shù),實現(xiàn)企業(yè)從內(nèi)容入庫到內(nèi)容管理再到內(nèi)容分發(fā)全鏈路的智能運營,協(xié)助企業(yè)最大化挖掘私域價值。易有料期待與更多的行業(yè)朋友們一起探索內(nèi)容的價值與內(nèi)容行業(yè)的未來發(fā)展趨勢,助力企業(yè)內(nèi)容營銷的數(shù)字化轉(zhuǎn)型。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )