近日,奧比中光在VALSE 2021(視覺與學(xué)習(xí)青年學(xué)者研討會)上首次展示了公司自研的3D智能摳圖算法。該算法專門為直播帶貨、視頻會議等場景研發(fā),可清晰地?fù)溉‰s亂背景下的3D人像與物品,吸引了眾多青年學(xué)者與學(xué)子駐足交流。
奧比中光研究院算法團隊負(fù)責(zé)人錢貝貝博士VALSE 2021演講時,為聽眾分享3D視覺從“感知”到“認(rèn)知”的基本原理,并介紹了奧比中光在3D視覺算法方面的最新研發(fā)突破。同臺演講的企業(yè)還包括百度、騰訊優(yōu)圖、美團、格靈深瞳、??低暤取?/p>
3D智能摳圖算法首次亮相,可摳取雜亂背景中的人像與物品
奧比中光最新研發(fā)的3D智能摳圖算法實現(xiàn)了基于背景建模的輕量化前景摳圖,能夠?qū)崟r摳取雜亂背景中的3D人像及物品,彌補了諸多2D摳圖的缺陷。另外,3D智能摳圖不限類別,并可自定義摳圖距離,過濾掉背景中不相關(guān)的人物,從而保護用戶隱私。
錢貝貝博士在演講中介紹,奧比中光通過背景+人圖軟分割的方法,設(shè)計了輕量化的Stage Block網(wǎng)絡(luò)框架,并基于大量數(shù)據(jù)訓(xùn)練,實現(xiàn)了人、物與背景的精確分割,并可根據(jù)不同需求平衡摳圖的精度與速度。
圖注:奧比中光研究院算法團隊負(fù)責(zé)人錢貝貝博士在VALSE 2021發(fā)表演講。
3D智能摳圖算法有何應(yīng)用場景?據(jù)了解,奧比中光這一算法專為直播帶貨、視頻會議等場景研發(fā),還可應(yīng)用在游戲渲染、場景理解、自動駕駛、目標(biāo)跟蹤、混合顯示、電影制作等多元領(lǐng)域。
以近年來爆火的直播帶貨為例,主播往往需要將普通的辦公室、居家背景替換成華麗的直播間,借此吸引粉絲;在直播過程中,主播要在眾多品類的商品中向觀眾展示主推產(chǎn)品。傳統(tǒng)的2D摳圖算法在應(yīng)對這一場景的需求時,常常會出現(xiàn)無法摳取物品、細(xì)節(jié)丟失、多摳背景中的無關(guān)人物等問題。
圖注:現(xiàn)有在線視頻會議軟件中的2D摳圖和奧比中光3D摳圖效果對比。
奧比中光的3D智能摳圖則能較好地解決以上問題。據(jù)悉,3D摳圖的基本思想就在于利用三維空間的距離信息來區(qū)分需要摳取的前景(如主播、商品、參會人員)與不需要被摳出的背景(如墻面、雜物與不相干人物)。高精度3D數(shù)據(jù)的加持為算法提供了先驗信息,有利于將細(xì)節(jié)處理得更好,同時能給完成相似紋理下的高難度摳圖,并且能通過自定義距離過濾背景人物,保護隱私。
3D視覺感知技術(shù)加速迭代,賦能多元應(yīng)用開發(fā)
奧比中光自研的3D智能摳圖算法,正是公司在3D視覺感知技術(shù)領(lǐng)域全面布局、全棧縱深的又一次成果展示。
據(jù)悉,奧比中光作為一家3D視覺感知整體技術(shù)方案提供商,在技術(shù)縱向上對包括深度引擎芯片、感光芯片、專用光學(xué)系統(tǒng)等在內(nèi)的核心底層技術(shù)及SDK、行業(yè)應(yīng)用算法等全鏈路技術(shù)進行全棧式自主研發(fā),并在技術(shù)橫向上對結(jié)構(gòu)光、iToF、雙目、dToF、Lidar、工業(yè)三維測量進行全領(lǐng)域布局。
圖注:觀眾在奧比中光展位上觀看3D智能摳圖算法演示。
奧比中光此次推出的3D智能摳圖算法,很大程度上依托于公司此前在3D視覺感知技術(shù)上的積淀。如要使得算法更好地?fù)溉∪讼瘛⑽锲?,就需要在輸入環(huán)節(jié)保證3D數(shù)據(jù)的精確度,而奧比中光研發(fā)的一系列3D攝像頭能夠為之提供硬件級支撐。
同時,奧比中光所布局的幾種3D視覺感知技術(shù)在底層原理上具有共通性,這使得算法研發(fā)過程中可以借鑒原有技術(shù)的成熟模型,在此基礎(chǔ)上迭代創(chuàng)新,實現(xiàn)更優(yōu)的性能。
基于從感知到認(rèn)知全鏈路的技術(shù),奧比中光得以賦能智能化行業(yè)向3D化升級。奧比中光近期展出的FemtoiToF相機、3D視覺機器人開發(fā)套件等產(chǎn)品,可助力3D視覺行業(yè)的眾多專業(yè)人才開發(fā)各行各類3D應(yīng)用,促進3D視覺行業(yè)加速發(fā)展。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )