原標題:用較低成本,給予最好的視頻體驗,智感超清到底有多強?
當前互聯(lián)網(wǎng)已全面進入視頻化時代,視頻流量越來越龐大。對于視頻應用平臺來說,帶寬成本支出也是非常大的。如何通過技術(shù)實現(xiàn)在最小的帶寬消耗下,最大幅度的提升用戶的觀看體驗是所有視頻應用平臺所追求的目標。
在云智峰會上百度智能云重磅發(fā)布了“智感超清”產(chǎn)品,集成多種視覺AI與編碼技術(shù),通過深度學習技術(shù)對畫面內(nèi)容進行分析,根據(jù)視頻場景及復雜度,智能調(diào)節(jié)編碼參數(shù),減少視頻畫面不必要的碼率分配,最大能節(jié)省50%+的視頻碼率。同時通過畫質(zhì)修復、色彩增強等技術(shù),優(yōu)化主觀視覺體驗,大幅提高畫面質(zhì)量,讓視頻在更低的帶寬下實現(xiàn)更清晰的觀看體驗。
目前,百度智能云智感超清產(chǎn)品已全面應用于百度系視頻APP,如好看視頻、全民小視頻,每月節(jié)約數(shù)TB級的帶寬成本。
01基于內(nèi)容自適應的智能編碼
實際生產(chǎn)環(huán)境中,視頻內(nèi)容類型和畫面復雜度多種多樣,傳統(tǒng)在碼率控制方式上以VBR或者CBR為主。CBR碼率非常恒定,但是它的質(zhì)量波動比較大從而導致質(zhì)量得不到保障;VBR的質(zhì)量相對較好,但是需要對所有的視頻預設一個平均碼率導致視頻Size增加。
智感超清要解決的最根本問題是如何從視頻內(nèi)容的復雜度、視頻質(zhì)量、視頻碼率三者關(guān)系中找到最優(yōu)平衡點,既能保證視頻編碼質(zhì)量,又能提升壓縮率,節(jié)省傳輸帶寬。
從技術(shù)上來說,內(nèi)容自適應編碼的粒度從粗到細分為視頻類別(Category)、視頻級別(Title)、分片級別(Chunk)、場景級別(Shot)、幀級別(Frame),智感超清目前實現(xiàn)了場景(Shot)級別的碼率智能分配。
百度智能云技術(shù)團隊選取了大量測試序列,從測試序列中獲取時間復雜度與空間復雜度信息,并對不同的序列按照復雜度進行分類,以保證測試序列能夠覆蓋盡可能多的實際場景。通過大量測試序列的評測及數(shù)據(jù)標注,深入分析視頻場景、復雜度、視頻編碼參數(shù)及視頻質(zhì)量的關(guān)系,建立視頻特征數(shù)據(jù)庫。然后通過AI深度學習模型進行訓練,通過模型預測可以得到待編碼的視頻在一定視頻質(zhì)量下的最優(yōu)編碼參數(shù)。簡單的場景分配較低的碼率就能獲得較好的畫面質(zhì)量,同時能降低文件大小,而較復雜的場景則分配較高的碼率去獲得較好的畫面質(zhì)量,當然這里可以設定最大碼率限制,從而去控制文件大小。
總之,智感超清1.0在人眼主觀上實現(xiàn)了一個恒定質(zhì)量的用戶體驗,同時能節(jié)省50%+的帶寬成本和存儲成本。
02基于人眼感觀的增強優(yōu)化
UGC短視頻行業(yè)場景下,存在著大量的由于拍攝問題或者壓縮問題帶來的色彩灰暗、壓縮噪點等低質(zhì)量的視頻,而很多經(jīng)典老片也存在膠片顆粒、劃痕等問題,非常影響人眼的主觀感受。
智感超清產(chǎn)品基于最新的AI技術(shù),實現(xiàn)了創(chuàng)新性的視頻增強解決方案,采用畫質(zhì)修復和色彩增強,可以在不增加額外帶寬的前提下提升視頻的顯示效果。
其利用深度學習技術(shù)對畫面的顏色、亮度、對比度、飽和度等進行調(diào)優(yōu),并對邊緣紋理信息進行增強,去除抖動、劃痕、噪點等,讓畫面看上去更漂亮,從而提升視頻人眼感官的質(zhì)量。
技術(shù)實現(xiàn)上的基本思路是利用多幀相關(guān)信息去除壓縮引起的噪聲、塊效應、偽影等,利用周邊質(zhì)量較高的幀提升當前幀質(zhì)量。并通過運動估計網(wǎng)絡,經(jīng)過運動補償模塊生成幀間預測信號,再把前后幀的補償圖像和當前幀輸入到視頻增強網(wǎng)絡,最后輸出主觀增強后的視頻。
? 老片修復樣例:
? 主觀增強樣例:
除此之外,從視頻壓縮的角度出發(fā),為了突破基于傳統(tǒng)信號壓縮編碼極限,必須充分利用人眼視覺系統(tǒng)(HVS)的特性,采用了感興趣區(qū)域(ROI)編碼技術(shù),提高了視頻的質(zhì)量。即在幀內(nèi)碼率分配環(huán)節(jié),可以重點考慮人眼感興趣的區(qū)域,比如運動、人臉、膚色、文章、紋理等區(qū)域,采用合適的量化參數(shù),確保將有限的碼率分配到人眼更關(guān)注的重點區(qū)域,取得更優(yōu)的主觀質(zhì)量。
03超分辨率
4K的電視屏幕越來越普及了,但是視頻源上卻嚴重不足。大量庫存的標清、高清資源,可以通過基于視頻的超分技術(shù)重制到4K超高清,實現(xiàn)快速的內(nèi)容供給。
超分辨率是指將視頻從低分辨率,采用AI的方法采樣重建到高分辨率的視頻(如SD->HD 或 HD->4K),并提升視頻畫面的細節(jié)。在生成4K視頻的過程中,采用AI技術(shù)智能生成內(nèi)插幀,可以實現(xiàn)將50i或者25fps的視頻,上采樣到50fps,同時支持HDR、10bit,達到真4K的標準。如下圖所示,通過在服務端實現(xiàn)基于AI的超分辨率服務,可以將低清版本的視頻,恢復成高清或者超高清版本的視頻,以滿足內(nèi)容分發(fā)的需求。
同時,百度智能云技術(shù)團隊正在開展超分技術(shù)在移動端的應用探索。在直播或者點播領(lǐng)域,傳輸一路較低分辨率的視頻,通過移動端的超分渲染,達到高清的效果,即節(jié)省了視頻傳輸帶寬,又提升了終端的用戶體驗。
▽
結(jié)尾
更高更清晰的視頻編碼,更好的終端用戶體驗,是視頻技術(shù)不斷追求的目標。5G和AI技術(shù)的發(fā)展,也促進了視頻向超高清4K視頻的應用落地。我們將AI技術(shù)應用到了從視頻采集、壓縮、上傳、轉(zhuǎn)碼、分發(fā)到播放的整個視頻技術(shù)棧中。
? 通過智能編碼,基于內(nèi)容自適應的最優(yōu)編碼參數(shù)設置,獲得了恒定的視頻質(zhì)量,同時帶寬最節(jié)省。
? 通過基于AI的主觀質(zhì)量增強,獲得了更適合于人眼的高清畫質(zhì)。
? 通過超分辨率技術(shù),進一步提升圖像細節(jié),重塑畫面質(zhì)量。
? 通過基于AI的復雜度預測,在轉(zhuǎn)碼工程上實現(xiàn)智能化的調(diào)度,實現(xiàn)極速轉(zhuǎn)碼,降低端到端的時效性。
未來,百度智能云將持續(xù)輸出AI能力,為廣大視頻平臺、視頻用戶甚至更廣泛行業(yè)中的視頻生產(chǎn)者與使用者們提供更豐富的視頻產(chǎn)品,更好地服務于真實生活場景,驅(qū)動視頻行業(yè)發(fā)展,惠及更多用戶。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。