近年來,應用場景的旺盛需求,推動AI領域將技術能力從感知延伸到認知、從2D擴展到3D。
3月19日,云從科技基于單幀圖像的3D人體重建技術同時在Human3.6M、Surreal和UP-3D上創(chuàng)造了最新的世界紀錄,此次突破將原有最低誤差記錄大幅降低30%,也是繼去年云從在3D人臉數(shù)據(jù)集上大幅刷新紀錄后,再次在此類3D重建技術上取得重要成果。
Human3.6M數(shù)據(jù)集上對比
Surreal數(shù)據(jù)集上對比
UP-3D數(shù)據(jù)集上對比
3D重建領域通常以誤差(Error)作為衡量算法能力的主要指標,誤差(Error)就是生成模型與實際圖像的差別。一般來說,誤差(Error)越低,精度越高,意味著技術的性能越好。
云從科技3D人體重建技術全身精度誤差(Surface Error)在Surreal上從75.4毫米降低到52.7毫米,關節(jié)精度誤差(3DJointError)從55.8毫米降低到40.1毫米,Human3.6M上的關節(jié)精度誤差(3DJointError)從59.9毫米降低到46.7毫米,技術的執(zhí)行速度從之前的上百毫秒降低到僅需5毫秒。
論文中,云從科技針對人體具有豐富多樣的姿態(tài)和穿著的特點,提出了一套全新的基于人體3D縱深預測的3D信息表征方式。通過對三原色圖像(RGB,不含深度信息)的分析,預測人體的3D形態(tài)和姿勢,并用6萬多個點完整描繪人體,從而在人體重建技術上取得速度與精度的雙突破,呈現(xiàn)出來的模型更精細,幀率更是高達到200fps,原本由于受實時顯示限制而無法實現(xiàn)的應用可以一一實現(xiàn)——這將極大地推動相關智能圖像應用的落地步伐。
由于對輸入圖像的要求低,使3D重建技術將可以利用普通光學攝像頭作為感知設備。該技術將會使美顏APP無需結構光攝像頭也能具備高精準度的瘦身與動畫合成功能;商場內(nèi)試衣魔鏡將會自動根據(jù)身形生成你所想要更換的衣服,大大節(jié)省商場空間的同時提升用戶體驗度,使更多智能應用成為可能。
通過重要人員影像重建、醫(yī)療仿真肢體打印、虛擬試衣、美顏化妝、表情姿態(tài)動畫合成等應用場景在大型商場、直播平臺、美顏軟件、影視特效制作等行業(yè)普惠AI能力。
值得一提的是,Human3.6M、Surreal和UP-3D是全球關于3D人體重建技術的權威數(shù)據(jù)集,加州大學伯克利分校、馬克斯-普朗克研究所、Amazon、賓夕法尼亞大學、北京大學、浙江大學、MicrosoftResearch、法國國家信息與自動化研究所、AdobeResearch等知名企業(yè)、研究所和大學都在該榜單的競爭隊列中,算法實力比拼可謂激烈,相較于以往,中國企業(yè)與高校機構開始逐漸在國外老牌優(yōu)勢領域展露頭角。
與傳統(tǒng)關鍵點檢測、3D重建技術的區(qū)別
傳統(tǒng)的人體關鍵點檢測技術往往以2D的人體骨骼關節(jié)點檢測形式出現(xiàn),即通過技術預測RGB圖像中人體的十幾個關節(jié)點的坐標,一方面結果非常稀疏,將人體大為簡化成骨骼的形式,另一方面結果往往只包含二維平面上的坐標預測,不能還原深度信息,因此無法體現(xiàn)縱深的感覺。而基于單幀圖像的3D重建技術不僅能輸出骨骼關節(jié)點信息,更能同時預測大量的人體表面關鍵點信息,預測結果更加豐富,而且每個點的坐標都是3D的,能夠體現(xiàn)不同軀干的縱深信息。
3D關鍵點檢測
并且傳統(tǒng)3D重建技術大多需要連續(xù)的圖像序列或是多視角的圖像,在硬件設備上一般需要采用雙目攝像機或者結構光攝像機等設備,因此在手機等便攜設備上往往難以實現(xiàn);另一方面,專用設備還會增加部署成本,增加大規(guī)模普及3D重建技術的難度。
基于單幀圖像的3D重建技術對原始圖像的需求放松的同時,對背后的技術提出了更難的挑戰(zhàn):技術需要從單幀圖像中推理出人體或人臉的3D形態(tài),并通過【光學透視】【陰影疊加】等基本光學原則準確預測出各個關鍵點在3D空間的位置和朝向,從而得到人體的姿態(tài)或表情信息。
人體姿態(tài)和服飾復雜多樣,精度提升意味著對復雜場景的適應性更好,模型更接近真實的情況。如阿凡達、漫威電影、阿麗塔等電影中,都需要專用特效設備與面部貼點來完成精細的人像采集,基于單幀圖像的3D人體/人臉重建技術將徹底顛覆電影視頻的拍攝制作,同時降低工業(yè)級3D動畫合成的門檻。
- 特斯拉Model Y新版預售,iPhone 18 Pro系列升級,汽車界與科技界碰撞新火花
- 小鵬汽車何小鵬回應特斯拉 Model Y 撞臉風波:設計碰撞,靈感碰撞,究竟誰更勝一籌?
- 日本車商2024年新車銷量下滑,本田跌至近10年最低位,中國市場面臨挑戰(zhàn)?
- 英偉達批評美政府AI芯片出口限制:限制不利己,全球轉向替代技術之風
- 特斯拉煥新Model Y難敵華為問界R7,智能科技誰領風騷?
- 開源巨頭聯(lián)手打造Chromium聯(lián)盟,推動Linux生態(tài)創(chuàng)新發(fā)展
- 曹德旺巨資辦校,福耀科技大學引領行業(yè)新風向,培養(yǎng)未來之星
- 愛馳汽車陷股權凍結風波,能否順利復工復產(chǎn)引關注
- 小鵬汽車CEO何小鵬:雷軍不僅直言不諱,還勸我多做營銷,不失為良師益友
- 馬斯克大膽計劃:未來十年內(nèi)特斯拉機器人產(chǎn)能提升10倍,300億機器人將顛覆各行各業(yè)
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。