不久前的百度聯(lián)盟生態(tài)峰會,一向低調的向海龍出來做了一個“新視代”的主題演講。演講內容多與視頻有關,比如視頻剪輯、視頻制作等等,其中提到了很多百度AI的技術能力。
會后,很多人把它看作是百度進入視頻領域尤其是短視頻領域的征兆。這也不怪他們,主要是現(xiàn)在視頻正火,被抖音、快手和騰訊的競爭所感染,百度又在重要的場合不談AI談視頻,難免會有人聯(lián)想一下。
實際上,如果你全程聽完了向海龍的演講就會發(fā)現(xiàn),至少他這次演講中的內容和現(xiàn)下正火的短視頻完全不是一回事。
言簡意賅的說,向海龍所表達的觀點是AI賦能視頻。
AI+視頻成為可能,百度給視頻插上AI的翅膀
向海龍在演講里提到一件事,為何這么長時間視頻一直沒有成為主流的信息記錄模式?他用四個難題概括了一下:生產難、存儲難、傳輸難和檢索難。四個難題我就不展開說了,著重講一下解決辦法。
智能手機的普及、網盤的誕生、移動網絡和WIFI的提速以及AI技術的應用,是向海龍給出的四個解決辦法。而這四個辦法中,百度希望從其中兩個入手,給視頻插上AI的翅膀。
一個是視頻生產,向海龍的演講中列舉了很多視頻制作的方法,都是用百度的AI技術賦能制作工具,其核心目的是讓復雜的視頻制作簡單化、傻瓜化。
比如在線視頻的形體修正,可以讓一個小胖子瞬間變得苗條。這就用到了百度的人體識別和形體美化的技術,可以自動識別視頻當中的人體形象,在此基礎上進行形體效果的再合成。
另一個是視頻檢索,這是一個比文字、圖片檢索更難的工作。在向海龍的演示里我們看到,百度AI已經可以做到完整分析出一段視頻中的內容,如舞臺、人物、物品、臺詞等信息,并把這些信息組合到一起生成標簽,就像給一本書重新做了一個目錄,可以檢索定位信息所在的位置。
所以你看實際上百度做的工作是提供工具,讓視頻生產更簡單、視頻檢索更高效。當然這也是有歷史背景的,當下的視頻領域多以強運營為主,也就是為用戶提供盡可能多的創(chuàng)作手段好讓UGC能夠達到PGC的程度,簡單來說就是讓普通用戶能隨手拍出大片的感覺。
那么也許有人會問,為什么百度現(xiàn)在開始談這個事情?我想答案有三,其一整個信息產業(yè)的進階必定會令視頻這種信息傳輸方式成為未來的主流,它會超越圖文成為被廣泛應用的信息傳播媒介;其二,百度作為連接平臺其實就是視頻的傳輸管道,有責任有義務將管道修葺的更好更通暢;其三,為AI技術尋找合適的落地場景。
尤其是第三點,對百度AI技術的落地很有幫助。其實還有一個功能也是百度做AI+視頻的優(yōu)勢,即智能分發(fā)。基于AI,百度的信息流業(yè)務實現(xiàn)了迅猛增長,同樣也能延伸至視頻領域。
百度AI賦能的N種場景,使其成為信息時代的“飛機”
至此,我們可以斷定百度AI+視頻本質上不是轉型,而是站在更高維度賦能整個視頻產業(yè)和扶持合作伙伴,如同互聯(lián)網最初的工具使命一樣。
站在大環(huán)境下看AI+視頻,可能會更容易理解百度的做法。在互聯(lián)網女皇一年一度的互聯(lián)網趨勢報告里,著重提到了短視頻和長視頻的迅猛發(fā)展。視頻這種帶有更豐富信息元素的媒介毫無疑問會是未來主流的信息傳播模式,而信息傳播擁有必要的三個節(jié)點生產、傳播和接收,所以你看百度AI+視頻其實就是圍繞這三個節(jié)點來做事情。
向海龍?zhí)岬降囊曨l生產和檢索,正是對應生產和接收,利用AI技術讓用戶能夠更快更好的進行信息傳播。
從實際業(yè)務的角度看,百度近年來一直在尋找AI落地的具體場景。最開始的百度大腦,幫助搜索引擎進行高效、精準的信息分發(fā)和智能識別,后來的Apollo計劃和Duer OS也是在汽車和智能硬件的領域進行賦能,同樣今天在視頻領域,百度也是希望能夠讓AI技術以人們看得見、用得上的方式實現(xiàn)落地。
或者說,百度之所以選擇在聯(lián)盟生態(tài)峰會這樣一個如此重要的場合來談AI+視頻,我猜最主要的原因就是希望能夠讓合作伙伴和更多的人看到,百度AI能力的孵化到達了哪個階段,是實驗室還是實際業(yè)務。
所以也就不難理解向海龍為何會在演講中加入那幾個視頻案例了,因為這是百度AI能力的一個成人禮。
實際上,百度AI今天能做的事情已經很多,在AI+視頻領域,如向海龍?zhí)岬降男误w美化、人體識別、語音識別、人景分離、語音合成等等;在AI+金融領域,百度金融也就是度小滿擁有智能獲客、身份識別、大數(shù)據風控、智能投顧等七大能力,還有AI+汽車、AI+智能硬件等等。
“AI+”的落地場景其實很有想象空間,單單在視頻領域就不止現(xiàn)在的內容消費層面,未來在教育、醫(yī)療甚至O2O市場都存在巨大的市場機遇。比如教育與VR、AI的結合,就能讓虛擬教師和遠程教育的質量得到全面提升。
可以設想一下,一個北京四中的優(yōu)秀老師可以給分布在全國各地的幾萬名學生同時上課,而且通過人工智能的輔助,老師可以知道每一個人的理解程度,并且進行相應的交互溝通,這種跨越空間和時間的溝通將完全打破現(xiàn)在的教育格局。
所以,AI同互聯(lián)網本質是相同的,它提供了更加高效、立體的呈現(xiàn)方式,為所有的應用和程序提供一個基礎架構。我打個比方,如果說互聯(lián)網是信息時代的“高速公路”,那么AI就是“飛機”,是信息時代的新基建設施。
再回到AI+視頻的事情上來,就更容易理解了。向海龍所講的AI+視頻,其實就是百度為合作伙伴提供的一種靈活且具有彈性的服務和工具,是百度AI技術的一種應用體現(xiàn)。
以往談論AI,我們可能會更多關注AI技術本身,忽略了AI的落地和應用場景。而百度這次著重引出AI+視頻技術的落地,就是向外界傳遞一個觀念,未來借助AI對其他行業(yè)進行賦能的大幕已經拉起,AI+視頻只是一個起步。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。