AI+3D,一項具有革命性改變的感知技術(shù),正在慢慢向工業(yè)生產(chǎn)、硬件制造,以及人們?nèi)粘I顫B入。
3D感知硬件能夠提供距離、深度等數(shù)據(jù)信息,但這并不是單純的數(shù)據(jù),而是基于這些數(shù)據(jù),通過不同的表達和理解方式,實現(xiàn)不同的應(yīng)用。比如對三維場景進行數(shù)字化建模,或者繪制三維地圖,從而讓機器能夠?qū)崟r感知自己在所處空間中的位置,以便在運動時及時避開障礙物等。
這需要根據(jù)深度信息生成深度圖像,并與RGB圖像,甚至是紅外圖像進行融合并完成大量計算。
而商湯科技向筆者表示,通過硬件感知信息生成的深度圖像,往往存在因硬件性能限制而產(chǎn)生瑕的疵。例如在細小或復(fù)雜交錯的物體之間,出現(xiàn)深度信息估計錯誤等問題。此外,精準(zhǔn)度、魯棒性、實時性、效率等都是決定實際應(yīng)用效果的關(guān)鍵。這些問題和應(yīng)用效果都需要依靠額外的算法進行實時處理予以彌補和增強。
據(jù)悉,AI可通過對大量實際數(shù)據(jù)進行學(xué)習(xí),自行總結(jié)其中的規(guī)律和特征。這種方法可以在短時間內(nèi),完成傳統(tǒng)算法需要多年才能突破的問題,有效彌補硬件能力的不足。
3D硬件小型化,是3D視覺技術(shù)應(yīng)用場景拓展和創(chuàng)新的硬件基礎(chǔ),而AI技術(shù)則是真正的動力引擎,兩者密不可分。在商湯科技看來,AI+3D視覺技術(shù)拐點已至。
什么是AI+3D?
初次接觸,可能很多人,對于AI+3D這項技術(shù)有些陌生。但實際上,了解之后便會發(fā)現(xiàn),就如前文所說“AI+3D是一項最新的感知技術(shù)”。3D屬于成像技術(shù),是靠人兩眼的視覺差產(chǎn)生的?;跀z像頭獲取的圖像信息,視覺技術(shù)可以搭配AI技術(shù)解決各種實際應(yīng)用問題。
這些深度圖像信息則可以豐富AI圖像視覺技術(shù),如同人眼一樣對場景深度進行感知。商湯科技向筆者稱:“對于AI來說,能像人類一樣獲得深度信息后的感知能力,是他們研究這項課題的想法。行業(yè)早些年研究結(jié)構(gòu)光、ToF、雙攝等基于硬件設(shè)備技術(shù)都是為了帶來深度信息,搭配AI對3D圖像的感知能力,豐富不同領(lǐng)域的應(yīng)用”。
同時,光鑒科技首席執(zhí)行官朱力認為:“3D視覺技術(shù)的意義,是打開了更加廣闊的AI應(yīng)用空間。無論是輔助駕駛,還是各種虛擬現(xiàn)實、增強現(xiàn)實技術(shù)的應(yīng)用,這些前沿概念的落地都建立在信息交互基礎(chǔ)上。對正處于發(fā)展中的AI產(chǎn)業(yè)來說,3D視覺將幫助機器更好地“看”世界”。
據(jù)筆者了解,隨著硬件設(shè)備的小型化,AI+3D技術(shù)及其成熟的解決方案,可在手機應(yīng)用、人臉識別、AR/VR領(lǐng)域、汽車、工業(yè)等具有相關(guān)性領(lǐng)域進行研發(fā)和場景落地。
例如:通用3D重建技術(shù),從毛絨玩具、紙箱、書包、鞋子到雕塑,用戶只需拿手機沿著物體360度環(huán)繞掃描,就能將其掃描成數(shù)字化的模型。生成的模型文件可直接用于3D打印、3D/AR相冊預(yù)覽,也可應(yīng)用于生成短視頻直播的內(nèi)容并設(shè)置動畫,也可植入到AR養(yǎng)寵等游戲、電商的商品展示或預(yù)覽等場景中。
除此,在汽車領(lǐng)域,AI+3D技術(shù)能夠?qū)崿F(xiàn)更加精準(zhǔn)的人、車、物識別和距離感知,從而有力推動自動駕駛發(fā)展。在工業(yè)領(lǐng)域,AI+3D將進一步優(yōu)化工業(yè)生產(chǎn)流程,可為機械臂賦予3D感知能力,通過高精準(zhǔn)的SLAM、物體重建和測量等技術(shù),判斷立體物體所處的位置,以及相應(yīng)尺寸、形狀和質(zhì)量等信息,提升工業(yè)生產(chǎn)智能化能力。
目前,商湯科技已在人臉識別、汽車、工業(yè)、電商、手機等領(lǐng)域進行了深入研究。
AI+3D能否成為AI業(yè)又一“強心劑”
人工智能作為第四次工業(yè)革命的產(chǎn)物之一,給社會、工業(yè)、人帶來的是一場人機交互變革。與此同時在該產(chǎn)業(yè)也誕生了許多新興企業(yè),如:商湯科技、寒武紀(jì)、曠視科技、云從科技、同盾科技等估值達到或超過10億美元的AI企業(yè)。
按照產(chǎn)業(yè)鏈,從底層硬件到上層的應(yīng)用,整個AI+3D產(chǎn)業(yè)鏈可以分為四類廠商,在國內(nèi)外均有企業(yè)在進行相應(yīng)的開發(fā):一、3D感知硬件設(shè)備的相關(guān)供應(yīng)商,包括鏡頭、攝像頭模組、圖像傳感器,以及紅外光源等器件;二、基于3D感知的AI技術(shù)/算法提供商;三、手機廠商,將AI+3D軟硬件技術(shù)進行整合;四、應(yīng)用開發(fā)商,開發(fā)基于AI+3D技術(shù)的應(yīng)用。
很多AI企業(yè)則屬于第二類:基于3D感知的AI技術(shù)/算法提供商。
而本次AI+3D技術(shù)的應(yīng)用和產(chǎn)業(yè)鏈延伸更是將AI行業(yè)發(fā)展推向高潮。國外調(diào)研機構(gòu)QYResearch曾預(yù)測,全球3D技術(shù)市場規(guī)模2012年為796億美元,至2022年將達到3892億美元,年復(fù)合增長率為17.20%。
商湯科技認為,“ToF在智能手機上的加速應(yīng)用,有助于3D視覺技術(shù)的廣泛普及化,會成為接下來10年中非常重要的科技趨勢。業(yè)內(nèi)統(tǒng)計,2019年TOF新機出貨約0.5億臺,預(yù)估2020年將達到1.5億臺”。
在筆者看來,AI+3D技術(shù)所產(chǎn)生的價值則是對以往機器2D視覺認知的更新迭代或替代,可以讓機器通過視覺三維影像,更加智能化,對所處世界有一個較為全面且深刻的信息感知與理解。從人機交互、互動娛樂、內(nèi)容創(chuàng)作、身份驗證、拍照、電商等層面激發(fā)大量的創(chuàng)新應(yīng)用場景。改變傳統(tǒng)商業(yè)運作模式。
不過,目前除了商湯科技外,谷歌、微軟、曠視科技在AI+3D技術(shù)方面也有研究。據(jù)曠視科技云事業(yè)部高級副總裁吳文昊介紹稱,“該技術(shù)已在手機領(lǐng)域有多種案例出來,但包含算法和模組的整體解決方案仍是缺位,公司正在嘗試一種從上往下的整合方案,從3D應(yīng)用層往下依次至AI算法、解決方案,最后到攝像、傳感等硬件設(shè)備制造上”。
另有行業(yè)人士認為:“AI技術(shù)可以讓3D打印實現(xiàn)以機器制造機器人,這也是新一輪制造業(yè)革命的助推劑”。
作者:珍珍
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )