原標(biāo)題:富蘭克林的風(fēng)箏:ReID產(chǎn)業(yè)化拉開的計(jì)算視覺新序幕
請大家跟我想象一下,假如你的世界里突然沒有了電,會是怎樣?沒有了鬧鐘和手機(jī),沒有了燈光與網(wǎng)絡(luò),也沒有了電腦地鐵和飛機(jī)……
一切現(xiàn)代生活的便利,都源于1752年6月的一個(gè)雷雨天,富蘭克林放飛了他的風(fēng)箏,讓世界“看到”了電——當(dāng)時(shí)被認(rèn)為是最神秘、也是最危險(xiǎn)的力量之一。
近幾年來,人們面對城市中日益增多的智慧攝像頭,或多或少都會懷抱著如同“雷電”一樣的警惕。無數(shù)科幻電影都告訴我們,當(dāng)走在路上的自己被電腦錄入,出行軌跡就有可能被隨時(shí)偵查到……
顯然,這并不是因?yàn)槿斯ぶ悄埽ㄈ四樧R別)技術(shù)太強(qiáng)大,而是因?yàn)樗€不夠強(qiáng)大,至少在大眾應(yīng)用層面是如此。舉個(gè)例子,想要在精準(zhǔn)識別與個(gè)人隱私之間達(dá)到平衡,行人重識別(Person Re-identification,簡稱ReID)就是一個(gè)非常有用的計(jì)算視覺技術(shù)。
因?yàn)樗軌蛲ㄟ^質(zhì)量并不高的人臉圖片,快速檢索出不同攝像頭下的同一個(gè)目標(biāo)任務(wù)。
這會帶來什么改變呢?
首先,人的臉和指紋一樣獨(dú)特,而ReID技術(shù)無需依賴高精度的人臉圖像,也就避免了人們在公共場合被采集個(gè)人信息的憂慮;同時(shí),ReID分辨率夠高,在一些人臉識別無效的情況下,可以起到替代作用。
因此,ReID也成為計(jì)算視覺科技企業(yè)們攻關(guān)的對象。最近,依圖科技在ReID領(lǐng)域取得突破,刷新全球工業(yè)界三大權(quán)威數(shù)據(jù)集當(dāng)前最優(yōu)成績(SOTA),算法性能達(dá)到業(yè)界迄今最高標(biāo)準(zhǔn)。
這一標(biāo)準(zhǔn)意味著什么,能否成為ReID產(chǎn)業(yè)化的關(guān)鍵契機(jī)?
產(chǎn)業(yè)新動力:ReID的價(jià)值與門檻
本杰明·富蘭克林和他的風(fēng)箏實(shí)驗(yàn),代表了人類邁出了現(xiàn)代文明旅程的第一步。在那之前,沒人能想象有電的生活;而今天,數(shù)十億人已經(jīng)無法想象沒有電的生活了。
時(shí)代的需求和社會風(fēng)俗的推動(很多時(shí)候是阻撓),總會有人為技術(shù)的進(jìn)程助力。ReID即是如此。
相信大部分人都不會否認(rèn),人臉識別/計(jì)算視覺在城市中的應(yīng)用,正在給生活帶來越來越多的便利。
比如通過智能攝像頭來識別車流、車牌,實(shí)現(xiàn)高效率、低成本的安防;在火車站、機(jī)場等公共場所部署AI,實(shí)現(xiàn)犯罪分子的偵查和捕獲;幫助無人購物超市和商店提高用戶體驗(yàn);
再比如大家最熟悉的手機(jī)相冊,想要讓系統(tǒng)在不侵犯隱私的情況下實(shí)現(xiàn)照片聚類,ReID都是不可或缺的技術(shù)。
2018年,特朗普政府決定在美國南部墨西哥邊境追查非法入境者時(shí),大眾就擔(dān)心ICE和其他移民機(jī)關(guān)可能會把人臉識別應(yīng)用,從而導(dǎo)致錯(cuò)誤辨識某個(gè)人并使其被錯(cuò)誤拘留?因?yàn)樵诋?dāng)時(shí),人臉識別對于有色人群或女性的識別錯(cuò)誤率依然很高。
既然ReID技術(shù)能夠讓智能生活變得更精準(zhǔn)有序,那為什么久攻不下呢?這恐怕要從三個(gè)技術(shù)難點(diǎn)說起。
1.數(shù)據(jù)缺失。
我們知道,當(dāng)前大多數(shù)攝像頭的成像質(zhì)量、分辨率、環(huán)境變化等差異都很大。在交通運(yùn)輸、工業(yè)制造和城市規(guī)劃等實(shí)際場景下,99%的圖像都是不含人臉或人臉部分是極其模糊的,僅有幾個(gè)像素大小,這也導(dǎo)致在許多任務(wù)中,人臉識別算法經(jīng)常失效,需要ReID頂上。
而一個(gè)高精準(zhǔn)的ReID模型,要識別同一個(gè)人在多個(gè)攝像頭下的畫面,意味著其訓(xùn)練需要足夠龐大、且具備連續(xù)性的行為數(shù)據(jù)。但與其他計(jì)算視覺任務(wù)相比,ReID領(lǐng)域的公開數(shù)據(jù)集所含的ID數(shù)量比較小,不同攝像頭的數(shù)據(jù)中同一個(gè)人的外觀也可能發(fā)生巨大變化,這些都給算法分析造成了阻礙,需要在算法設(shè)計(jì)上做很多創(chuàng)新與研發(fā)。
2.計(jì)算壓力。
如前所述,ReID往往被部署到規(guī)模人群的行為軌跡分析上,這意味著系統(tǒng)需要處理的數(shù)據(jù)規(guī)模成倍增長。即使是采取1:N級(單一特征對比多種特征)的人臉識別,用來失蹤人口搜索等。加上角度、光線等復(fù)雜性,特征提取、對比、判斷都需要龐大的算力來支撐。
但現(xiàn)有的智能攝像機(jī)在本地終端無法部署足夠大的算力,往往會選擇將數(shù)據(jù)上傳到云端,再進(jìn)行識別和處理,不僅會造成一定的時(shí)延,延誤眾多關(guān)鍵任務(wù);也有可能導(dǎo)致城市大腦“數(shù)據(jù)擁塞”,延宕整個(gè)系統(tǒng)的效率。
3.成本限制。
那么,為什么不考慮為攝像頭等邊緣終端加上芯片呢?答案就是貴。高通量計(jì)算芯片往往意味著更高的性能和穩(wěn)定性,制程上自然也要求更小的納米數(shù),而ReID需要在泛工業(yè)場景中部署,如果為城市或工廠中的每個(gè)攝像頭都加載這樣高算力的ReID芯片,無疑是一筆巨大的開支,這也限制了ReID算法在大規(guī)模商業(yè)化場景中的落地。
顯然,想要讓ReID從一種技術(shù)遠(yuǎn)景完全照進(jìn)現(xiàn)實(shí),其所面對的困難和障礙并不小。這也是為什么,我們一直關(guān)注著致力于用ReID改善體驗(yàn)的公司。
用電子編織現(xiàn)實(shí):依圖這樣改變ReID
如果說富蘭克林的風(fēng)箏讓人類開始與電建立了聯(lián)系。那么,電力真正開始產(chǎn)生規(guī)模經(jīng)濟(jì),是從喬治·威斯汀豪斯(George Westinghouse)開始。他以交流電系統(tǒng)擊敗了愛迪生的直流電系統(tǒng),從而讓發(fā)電廠與遠(yuǎn)距離的用戶連接在一起。
而依圖在ReID中的表現(xiàn),正如這場世紀(jì)對壘一樣,對ReID的現(xiàn)實(shí)落地起到了關(guān)鍵作用。
為什么這么說呢?
首先,依圖升級了ReID算法的開發(fā)流程。通過結(jié)合AutoML等前沿技術(shù),依圖創(chuàng)新性地實(shí)現(xiàn)了模型參數(shù)的自動搜索與迭代,改變了算法依賴研究員手工設(shè)計(jì)與調(diào)優(yōu)的傳統(tǒng)開發(fā)流程。不僅降低了模型的訓(xùn)練成本,也讓算法的泛化性更強(qiáng)。
其次,進(jìn)一步提升了ReID算法的識別性能。依圖自研算法在業(yè)界最具影響力的三大ReID數(shù)據(jù)集Market1501、DukeMTMC-ReID、CUHK03上,將兩大關(guān)鍵指標(biāo)“首位命中率”(Rank-1 Accuracy),以及“平均精度均值”(Mean Average Precision,mAP)6項(xiàng)數(shù)據(jù)全部提升,達(dá)到了更高的mAP,目前達(dá)到了工業(yè)界第一,從而進(jìn)一步穩(wěn)固了中國AI在該任務(wù)上的領(lǐng)跑地位。
此外,ReID算法的實(shí)用潛力持續(xù)進(jìn)階。在實(shí)戰(zhàn)應(yīng)用中,依圖還依托自研的AI芯片QuestCore(求索), 在僅憑穿著、步態(tài)特征的條件下,將ReID做到2017年——2018年人臉識別的精度。當(dāng)時(shí),機(jī)場、火車站等公共場合已經(jīng)開始大規(guī)模使用人臉識別進(jìn)行安防保障了。這意味著,ReID也有望被以低成本的解決方案,盡快進(jìn)入現(xiàn)實(shí)場景之中,讓人們無懼且享受計(jì)算視覺帶來的順暢體驗(yàn)。
目前看來,依圖的創(chuàng)新將帶給ReID算法更好的成本比,以及更絲滑的應(yīng)用體驗(yàn),平衡了理想技術(shù)與現(xiàn)實(shí)困境之間的關(guān)系。
挑戰(zhàn)與機(jī)遇:ReID的未來路徑
必須承認(rèn)的是,要讓城市換一種“眼睛”看行人,并不是一件容易的事。
一方面,各個(gè)城市攝像頭體系的建設(shè)標(biāo)準(zhǔn)、密度,以及進(jìn)度都各不相同,要讓它們共同點(diǎn)亮ReID的“技能樹”,實(shí)現(xiàn)全面替換,還有許多與技術(shù)成熟度無關(guān)的挑戰(zhàn);
還要面對復(fù)雜實(shí)景的挑戰(zhàn)。即使ReID算法的首位命中率足夠高,只意味著算法能夠在特定的幾個(gè)場景數(shù)據(jù)集下準(zhǔn)確找出最容易識別或者匹配的那張。但現(xiàn)實(shí)中的場景遠(yuǎn)比這有限的幾個(gè)數(shù)據(jù)復(fù)雜的多,數(shù)據(jù)模糊、建筑物遮擋、天氣的改變等等,都會影響模型的實(shí)際表現(xiàn)。所以現(xiàn)在認(rèn)為ReID模型能夠應(yīng)付真實(shí)任務(wù),還為時(shí)過早。
這也是為什么,盡管依圖科技刷榜SOTA,算法性能達(dá)到了業(yè)界目前的最高標(biāo)準(zhǔn),但依圖的研發(fā)人員耿直地說,學(xué)術(shù)界的這三個(gè)數(shù)據(jù)集不能遠(yuǎn)遠(yuǎn)不代表工業(yè)界的最好水平,更精彩的表現(xiàn)還要放眼于實(shí)戰(zhàn)之中。
因?yàn)楸荣愔兴捎玫臄?shù)據(jù)集,早已限定好了規(guī)模和分布,屬于“應(yīng)試作業(yè)”;而在依圖實(shí)際落地的ReID項(xiàng)目中,還會遭遇更加復(fù)雜的數(shù)據(jù)、環(huán)境、參數(shù),是“奧數(shù)級別”的挑戰(zhàn)難度。
另外必須正視的一點(diǎn)是,要讓終端攝像頭完成高通量的實(shí)時(shí)計(jì)算,僅僅依靠研發(fā)端的突破還遠(yuǎn)遠(yuǎn)不夠,城市環(huán)境中是否具有足夠的邊緣計(jì)算節(jié)點(diǎn),是否有邊緣計(jì)算數(shù)據(jù)中心提供澎湃的算力支持,這些都需要整個(gè)產(chǎn)業(yè)鏈乃至城市決策者的共同合作。
由此不難發(fā)現(xiàn),在抵達(dá)ReID產(chǎn)業(yè)化的旅程中,科技企業(yè)起到了怎樣的作用呢?
以依圖為例,一方面,通過將自身科研優(yōu)勢與新興算法相結(jié)合,加快AI算法的落地。
比如依圖就將自身在芯片研發(fā)上的硬件能力,與通用化算法相結(jié)合,實(shí)現(xiàn)了軟硬件協(xié)同開發(fā),不僅取得了刷榜的好成績,更關(guān)鍵的是激活了ReID與芯片端的融合可能,讓更多的算力需求被釋放,從而帶動芯片產(chǎn)業(yè)乃至整個(gè)社會智能的進(jìn)程。
正如人臉識別逐漸滲透到社會的各個(gè)角落,ReID算法也將成為智能生活不可或缺的一部分。借助AI芯片QuestCore?(求索)和ReID模型應(yīng)用,依圖將催化出多大的商業(yè)富礦,構(gòu)筑基于ReID的新產(chǎn)業(yè)鏈。
1752年,富蘭克林爬上屋頂放飛一只風(fēng)箏的時(shí)候,可能并沒有想到,他將改變整個(gè)世界的科技認(rèn)知與生產(chǎn)基礎(chǔ)設(shè)施。
而ReID對城市計(jì)算視覺應(yīng)用的迭代,也將為人類帶來新的視角與光輝,并在不遠(yuǎn)的未來成為與我們生活休戚相關(guān)的一部分。
廟堂之高,與江湖之遠(yuǎn)的疊加,就是依圖乃至整個(gè)AI產(chǎn)業(yè)所扎根的廣袤土壤。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。