原標(biāo)題:制造“空間魔術(shù)”:為未來取暖的騰訊多媒體實(shí)驗(yàn)室
對80、90后包括00后來說,人生中很多“見證奇跡的時(shí)刻”,都是與騰訊旗下一款款國民級產(chǎn)品共同度過的。比如第一次向千里之外的網(wǎng)友發(fā)出那句“你好嗎”,感受到了天涯若比鄰的真正含義;又像是第一次用微視拍一條小視頻,看到貼圖與自己的臉龐完美貼合,體會到數(shù)字世界與現(xiàn)實(shí)世界是怎樣連接的奇妙。
技術(shù)之于現(xiàn)實(shí)世界魔術(shù)一般的驚人改變,很多時(shí)候都是這樣,以一款產(chǎn)品為契機(jī),去改變一個(gè)用戶、一個(gè)群體乃至一代人的生活。
而魔術(shù)制造者從不休息。2019年12月25日,云視頻會議產(chǎn)品“騰訊會議”正式發(fā)布,在背后為其提供支持的便是神秘的騰訊多媒體實(shí)驗(yàn)室。
今天我們不妨從“騰訊會議”的魔術(shù)出發(fā),去探尋其背后的魔術(shù)工廠。
遠(yuǎn)程會議:移動辦公的最大短板
說起遠(yuǎn)程會議,估計(jì)我們的各位“社畜”讀者已經(jīng)非常熟悉了。在分布式辦公、移動辦公非常普遍的今天,隨時(shí)打開微信群語音交流工作,或是開啟QQ群視頻來一場遠(yuǎn)程會議,都是很普遍的事。
但遠(yuǎn)程會議的體驗(yàn),過去是大家有目共睹的差——通話延遲十分常見,更讓人煩惱的是如果誰所處的環(huán)境有噪聲,便會影響所有人的體驗(yàn)。尤其很多筆記本電腦的收音設(shè)備都距離鍵盤很近,在做會議記錄時(shí),往往需要暫時(shí)關(guān)閉麥克風(fēng)才能保持不打擾他人。像挪動水杯、一兩聲咳嗽這樣在面對面會議中很常見情況,在遠(yuǎn)程通話中都會變成干擾會議的噪音。更別提視頻會議時(shí),直面攝像頭的尷尬了。
而這種情況并非無法解決。很多軟硬件廠商也會選擇用降噪算法、壓縮算法等方式來優(yōu)化網(wǎng)絡(luò)通話體驗(yàn)。但在會議場景中,卻很難找到相對理想的統(tǒng)一解決方案。尤其從鍵盤打字這種近音干擾噪音如何優(yōu)化,到多人通話的低時(shí)延保持,再到視頻流與音頻流結(jié)合的優(yōu)化,往往都是移動會議場景才會面對問題。如果沒有針對性的解決措施,用戶很難找到替代方案。
而騰訊會議這款產(chǎn)品,就是針對這一場景的驚人“空間魔術(shù)”。
空間魔術(shù):騰訊多媒體實(shí)驗(yàn)室如何把同事“變”到你身邊?
騰訊會議的魔術(shù)可以被分為四個(gè)部分:音畫、聯(lián)通、評估與網(wǎng)絡(luò)。
在音畫方面,騰訊多媒體實(shí)驗(yàn)室不僅提供了視頻美顏算法,還特地收錄了車站噪聲、風(fēng)雨噪聲等常見的環(huán)境噪聲,以及咳嗽聲、鍵盤聲、放水杯聲等常見的會議噪聲。通過定點(diǎn)降噪處理,剝離噪音還原清晰人聲。同時(shí)騰訊多媒體實(shí)驗(yàn)室還打通了VoIP、PSTN等多種語音通話技術(shù),在盡可能廣泛的帶寬和采樣率中應(yīng)用音頻超分算法,通過技術(shù)處理提升語音品質(zhì)。不僅如此,多媒體實(shí)驗(yàn)室還推出了真實(shí)網(wǎng)絡(luò)場景的語音質(zhì)量運(yùn)維和保障方案。在提供良好的通話效果之外,也通過這一方案幫助用戶更好地對雜音、噪音進(jìn)行定位,為通話效果提供保障。
在音畫能力和聯(lián)通能力背后,重要的支撐力就是評估能力。大多數(shù)時(shí)候遠(yuǎn)程會議通話的清晰與否,都只能由用戶自己主觀判斷。這對會議通話的產(chǎn)業(yè)化發(fā)展是非常不利的。而騰訊多媒體實(shí)驗(yàn)室則擁有專業(yè)的音視頻實(shí)驗(yàn)室和測試設(shè)備,利用上百個(gè)符合ITU/3GPP/AVS等國內(nèi)外標(biāo)準(zhǔn)的指標(biāo)對通話質(zhì)量進(jìn)行評估。多媒體實(shí)驗(yàn)室自己也建立了大規(guī)模音視頻主觀質(zhì)量數(shù)據(jù)庫,在此基礎(chǔ)之上研發(fā)了可以部署到業(yè)務(wù)線中的評估算法。這樣一來不僅在研發(fā)時(shí)可以有衡量標(biāo)準(zhǔn),也可以監(jiān)控用戶的體驗(yàn)質(zhì)量。最后,針對多方通話可能面對的各方網(wǎng)絡(luò)連接狀態(tài)不同的情況,騰訊多媒體實(shí)驗(yàn)室還應(yīng)用了智能網(wǎng)絡(luò)探測算法,覆蓋多種網(wǎng)絡(luò)類型,在復(fù)雜的網(wǎng)絡(luò)環(huán)境之下提供優(yōu)質(zhì)的通話服務(wù)。
除此之外,騰訊會議還提供一鍵錄音、云端加密存儲等功能,讓產(chǎn)品形態(tài)更加完整,囊括會議進(jìn)行和會議記錄保存的整個(gè)周期。
如此一來,即使身處嘈雜的街邊,用戶也能享受到如同身處封閉會議間式的通話體驗(yàn)。科技就如同變魔術(shù)一般,讓身處天涯海角的人們在同一“空間”內(nèi)無礙溝通。
魔術(shù)師的進(jìn)階之路
從反復(fù)出現(xiàn)的名字就能看到,在空間魔術(shù)背后提供動能的“魔術(shù)師”,就是騰訊多媒體實(shí)驗(yàn)室。雖然這一名字較為新鮮,但騰訊多媒體實(shí)驗(yàn)室的魔術(shù)師進(jìn)階之路,卻從多年前就開始了。
想想開頭提到的,很多人小時(shí)候第一次“見證奇跡的時(shí)刻”就是通過QQ與遠(yuǎn)方的親人朋友聊天。但很快這種溝通模式就從文字進(jìn)化成了語音和視頻,也就是說,從很久以前,騰訊就已經(jīng)在處理語音視頻會話的技術(shù)問題了。
到了2011年左右,當(dāng)移動端產(chǎn)品逐漸普及,QQ語音通話這一體驗(yàn)和電話通話十分接近的功能迎來了更廣闊的需求。于是QQ成立了音視頻中心,開始著手解決語音視頻功能移動化的問題。尤其是弱網(wǎng)的適應(yīng)性、以及移動終端的豐富類型,都是在提供優(yōu)質(zhì)影音服務(wù)之前,必須要解決的問題。
從這一時(shí)刻起,騰訊多媒體實(shí)驗(yàn)室的技術(shù)基地開始加速累積。但也正因一開始為解決QQ產(chǎn)品需求而生,使得騰訊多媒體實(shí)驗(yàn)室的技術(shù)與QQ業(yè)務(wù)深度耦合。但到了2014年,隨著硬件能力的提升和普及,語音視頻服務(wù)開始出現(xiàn)在更多的產(chǎn)品之中——K歌、直播、游戲……尤其像直播、K歌等源自模式創(chuàng)新且注重運(yùn)營的產(chǎn)品,往往都是業(yè)務(wù)比技術(shù)優(yōu)化更先上馬。此時(shí)這些產(chǎn)品所向往的,正是已經(jīng)在應(yīng)用場景取得成果并且能夠盡快與自身業(yè)務(wù)場景結(jié)合的技術(shù)。騰訊自己也通過布局投資和成立新業(yè)務(wù)開始涉足這些領(lǐng)域,此時(shí)急需的,是技術(shù)與產(chǎn)品之間的解耦,完善SDK使技術(shù)可以復(fù)用,在更廣泛的空間中發(fā)揮價(jià)值。
于是在2016年騰訊音視頻實(shí)驗(yàn)室正式獨(dú)立,最終成長為今天我們所看到的騰訊多媒體實(shí)驗(yàn)室。從最初的成員數(shù)只有個(gè)位數(shù),到現(xiàn)在全球超過100多人的團(tuán)隊(duì),強(qiáng)大的人才儲備結(jié)合接近二十年的累積,還有無數(shù)次來自真實(shí)場景的技術(shù)煉金,一切都為這位魔術(shù)師累積了充足的工具箱。
從魔術(shù)師,到制造魔術(shù)的工廠
從騰訊會議這一款產(chǎn)品中,我們也能窺見一二。
除了能夠提供聲音降噪、音頻超分等語音方面的算法之外,在騰訊會議這款產(chǎn)品中還能見到騰訊多媒體實(shí)驗(yàn)室強(qiáng)大的編解碼能力。
例如在遠(yuǎn)程會議常見的屏幕分享場景中,常常會出現(xiàn)畫面卡頓、文字等細(xì)節(jié)內(nèi)容模糊的情況。騰訊多媒體實(shí)驗(yàn)室針對屏幕分享場景做了大量優(yōu)化。在編碼方面推出了專門針對屏幕內(nèi)容的屏幕內(nèi)容編碼器TSE,并在其中加入屏幕內(nèi)容編碼工具,以提升編碼效率。至于文字模糊問題,騰訊多媒體實(shí)驗(yàn)室則采用了YUV444編碼,很好地解決了因?yàn)樯确至肯虏蓸訉?dǎo)致的質(zhì)量損失。
在實(shí)時(shí)音視頻能力上,騰訊實(shí)驗(yàn)室除了有豐富的場景經(jīng)驗(yàn)外,還對于業(yè)界先進(jìn)的學(xué)術(shù)成果保持持續(xù)追蹤,就像在擁塞控制這一常見需求上,騰訊實(shí)驗(yàn)室就調(diào)研了各種學(xué)術(shù)界和業(yè)界最新的擁塞控制算法,結(jié)合自身累積的場景經(jīng)驗(yàn),提出了新的實(shí)時(shí)擁塞控制算法,在不同網(wǎng)絡(luò)場景下都能迅速給出可靠的帶寬預(yù)測,以便運(yùn)營方即時(shí)做出各種準(zhǔn)備。
不僅如此,騰訊多媒體實(shí)驗(yàn)室還在音視頻質(zhì)量評估、互動沉浸式媒體方面有著強(qiáng)大的累積。能夠?qū)崿F(xiàn)端到端的音視頻內(nèi)容質(zhì)量評估的客觀音視頻質(zhì)量評估算法,以及全新的互動式媒體交互手段,都是騰訊多媒體實(shí)驗(yàn)室已經(jīng)開始向產(chǎn)業(yè)世界所輸出的能力。
魔術(shù)師的帽子里,有抽不盡的彩帶、飛翔的白鴿和跳躍的兔子。一切都是為讓整個(gè)世界增添更多魔法色彩而服務(wù)。但一位魔術(shù)師,所面對往往只是一群人、一個(gè)劇場、一條街道。
在這里,我們就可以重新審視騰訊多媒體實(shí)驗(yàn)室的布局與籌劃。
騰訊強(qiáng)大的產(chǎn)品基因,以及優(yōu)圖、AI Lab、安全實(shí)驗(yàn)室等其他部門提供的豐富技術(shù)能力,最后加上騰訊云這一輸出口,可以讓騰訊多媒體實(shí)驗(yàn)室的技術(shù)擁有更妥帖的落地能力。目前除了在騰訊會議中外,全民K歌、斗魚直播、NOW直播等產(chǎn)品中,也能見到騰訊多媒體實(shí)驗(yàn)室所釋放的“空間魔術(shù)”。在接受采訪時(shí),騰訊多媒體實(shí)驗(yàn)室相關(guān)負(fù)責(zé)人也表示,未來騰訊多媒體實(shí)驗(yàn)室的技術(shù),將會盡可能地開放給社會,讓更多產(chǎn)業(yè)參與者能夠在此基礎(chǔ)之上優(yōu)化自身產(chǎn)品。
這樣看來,與其說騰訊多媒體實(shí)驗(yàn)室是某一項(xiàng)產(chǎn)品背后的魔術(shù)師,不如說這是一座“魔術(shù)工廠”,不僅用一只帽子里的兔子驚艷他人,而是源源不斷批量生產(chǎn)“魔法”,讓世界與狀態(tài)理想接軌——讓更流暢無卡頓的直播,拉近陌生人之間的距離?;蚴且皇谉o縫銜接的遠(yuǎn)程合唱,讓遠(yuǎn)在天邊的家人也能感受到一起K歌的快樂。
對于成長于互聯(lián)網(wǎng)和公寓樓中的千禧一代來說,遷徙、分離、孤獨(dú)似乎成了他們生活的常態(tài)。但一款能讓他們隨時(shí)聯(lián)系到家人朋友的通訊軟件,一種能讓他們相隔千里也有對坐而談感受的技術(shù),幾乎是生活的必需品。用技術(shù)消弭物理空間的阻隔,是這場空間魔術(shù)的最大魅力,也是騰訊一直在做的。而這一魔術(shù)顯然不會僅僅被騰訊擁有,而是通過云端撒向世界,如同一場溫暖的雪,為即將到來的未來取暖。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。