10月29日,在CPSE安博會高端訪談的現(xiàn)場,圍繞人工智能和安防等相關(guān)問題進(jìn)行了探討。此次會談由CPS中安網(wǎng)總經(jīng)理楊儒主持,邀請的嘉賓有:觸景無限科技(北京)有限公司CEO肖洪波、商湯科技南區(qū)銷售總監(jiān)陳治華、深圳云天勵飛技術(shù)有限公司產(chǎn)品總監(jiān)程冰、北京曠視科技有限公司解決方案總監(jiān)安洋、蘇州科達(dá)科技股份有限公司智能事業(yè)部總經(jīng)理晉兆龍(以上排名不分先后)。
以下內(nèi)容,在不影響嘉賓意思的語境下,有所更改。
主持人:大家怎么理解AI和安防落地相比其它行業(yè)會更快?
晉兆龍:我們在安防行業(yè)耕耘了很多年,對此有一個深切的體會。從原來傳統(tǒng)的智能算法開始,安防行業(yè)對于智能的需求是非常迫切的,也是一直存在的,只是原來的算法沒法滿足這種高端的需求,包括到現(xiàn)在深度學(xué)習(xí)出來之后,其實還有很多用戶關(guān)于智能方面的應(yīng)用需求還是被壓制的。隨著技術(shù)的前進(jìn),包括我們對行業(yè)應(yīng)用深刻的理解,從數(shù)據(jù)量的爆發(fā)到運算平臺的成熟,到客戶對這個應(yīng)用理解不斷地深入,包括很多現(xiàn)在技術(shù)上無法完美解決的東西,客戶也能通過他自身的不斷認(rèn)識提升,能夠得到一些容忍或者說一些變通的處理方法。
總體上來講,智能或者AI為安防行業(yè)的應(yīng)用賦能了很多東西,從這個角度上來講,加快了智能的發(fā)展和演進(jìn)。同時,本身安防行業(yè)大量的視頻監(jiān)控也具備大數(shù)據(jù)應(yīng)用的基礎(chǔ),我覺得這是兩個相輔相成的促進(jìn)。
安洋:首先為什么人工智能在安防行業(yè)落地很快,我認(rèn)為它有基礎(chǔ),現(xiàn)在全國已經(jīng)有2500萬+的攝像機,這些攝像機都不需要再改造,大部分就可以用來做人臉識別,所以它可以很快的落地,因為它不需要很多的基礎(chǔ)建設(shè)。第二是有需求,原因是現(xiàn)在公安的很多傳統(tǒng)的老三樣的手段,比如說敲門、查身份證、蹲點,這些手段已經(jīng)無效了,所以急需一些基于人臉、基于人形的方法來幫助他提高破案率,所以是有強烈需求的。第三就是技術(shù)的成熟和規(guī)模化的應(yīng)用,現(xiàn)在這么多的攝像機,技術(shù)也成熟到了一定程度,機器視覺的識別率已經(jīng)高于人類的識別率,所以在這種大數(shù)據(jù)的情況下,人工本來就看不過來,機器又比人看得準(zhǔn)。所以我們一直有一個理念,越來越多的攝像機不是給人看的,是給機器看的,而在見效快、有基礎(chǔ)、有需求的情況下,所以AI落地安防很快。
程冰:剛才各位都提到了現(xiàn)在的攝像頭數(shù)非常多,比較適合應(yīng)用人工智能技術(shù),我覺得這是其中一個方面。其實需求是從十幾年前一直都存在的,包括以前大家也有做人臉識別,也有做各種生物識別的,這幾年才非常火。我們覺得有三個方面的因素,第一方面是算法性能的提升,這兩三年做AI的公司基本上都采用深度學(xué)習(xí)的技術(shù),這個技術(shù)比以前的算法提升了10%到20%。第二,我們覺得是算力的提升,包括這幾年的GPU、FPGA這些在計算加速方面得到了大面積的推廣,成本也做得比較低,也便于一些AI公司做數(shù)據(jù)的訓(xùn)練,所以算力也讓技術(shù)得到了快速的進(jìn)步。第三,客戶的認(rèn)知的改變,以前客戶覺得你的準(zhǔn)確性要非常高,大數(shù)據(jù)也是這幾年普及的,我們把AI和大數(shù)據(jù)融合之后,從大數(shù)據(jù)里面能找到目標(biāo)的概率提升,這樣就能幫助客戶解決他切身需要的問題,所以他的認(rèn)知度有一個提升。
陳治華:這件事情我覺得首先要感謝領(lǐng)導(dǎo),他們在很多的大會上都講到人工智能,尤其是在去年6月15號,在百萬公安干警大會上,當(dāng)時都講到了人工智能,我們公安部門應(yīng)該用人工智能手段提升我們的偵查破案的效率,解決當(dāng)前警力不足的問題,這是開啟了大規(guī)模應(yīng)用的一個點,這是我最明確的感受。這個點結(jié)束之后,我再去拜訪公安局的時候就非常受歡迎,他們主動找我跟他們交流,我覺得這是很重要的一個點。包括今年十九大的會議上也提到了人工智能。
另外一點就是算法的突破,這個算法的突破為我們打開了一個瓶頸,深度學(xué)習(xí)為什么這么火?因為它是一種明確的方法,在人工智能領(lǐng)域發(fā)展了幾十年,為什么人工智能一直進(jìn)步很慢,可能就是大家沒有找到打開這個門的鑰匙,這個鑰匙就是深度學(xué)習(xí),商湯在2010年的時候,我們的創(chuàng)始人就用深度學(xué)習(xí)的方法在視覺領(lǐng)域進(jìn)行突破,這是很重要的一點。
還有一點就是算法的提升,其實這種規(guī)?;膽?yīng)用,云計算在公安的落地也就變成可能。今天算法突破之后,它就是一個二進(jìn)制的數(shù)據(jù),就不再是一張張的人臉,它可能是一個數(shù)據(jù)集,這些數(shù)據(jù)集就可以分析和應(yīng)用。因為是數(shù)據(jù),它不再是傳統(tǒng)的非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)是可以分析和利用的,這時候就可以產(chǎn)生很多有意思的事情,比如說布控、檢索、軌跡還原、同型高頻,這都是數(shù)據(jù)應(yīng)用的一種。這么大的應(yīng)用就需要很大的運算能力,所以需要云計算。所以我覺得云計算這樣一個概念在公安的大規(guī)模應(yīng)用,就把安防的產(chǎn)業(yè)有很大的提升,這種大規(guī)模應(yīng)用一定會帶來安防產(chǎn)業(yè)從平安城市到智慧城市的升級,我非??春梦磥碚麄€安防落地的情況。
肖洪波:主要有幾個方面促進(jìn)了現(xiàn)在人工智能的發(fā)展:
一、不僅僅在安防行業(yè),現(xiàn)在很多其他行業(yè)都在做和人工智能的結(jié)合。我記得去年我參加EVS(全球嵌入式智能會議),大家還在討論要不要在前端做人工智能,但今年大家都不討論了,今年討論的是怎么在前端做人工智能。
二、深度學(xué)習(xí)的出現(xiàn),某種程度上降低了圖象算法研究的門檻。我記得我當(dāng)時在UIUC的研究所里面做圖象搜索,大家要定義它的特征,做PCA分析,再做底層的搜索,我們大概花了兩三年的時間,做出來一個覺得還不錯的算法。但是現(xiàn)在你找一個實習(xí)生,他只要有比較好的數(shù)據(jù),他可以很快地做出來比我們當(dāng)時幾個很頂級的博士做出來的效果還要好的模型。所以說它從某種程度上降低了算法進(jìn)入的門檻。
三、算法的提升。2014年,我們和英特爾合作,基于它的平臺做的前端處理,完全可以做到1080P的圖象全幀率的處理,而且功耗在5瓦以內(nèi),它的前端的運算力得到了極大的提升。你只要把這個模型做有效的壓縮和優(yōu)化,你在前端也可以跑得很快。
主持人:大家剛才聊的自己的產(chǎn)品或方案,我們聊具體一點,這些能幫用戶解決哪些場景的問題?能幫他們解決哪些痛點?
肖洪波:我們關(guān)注的主要是在嵌入式這一端,另外我們也是一個中間提供商,我們并不做最終的產(chǎn)品,我們提供的主要是模組的解決方案。所以我們的客戶更多的是攝像頭的企業(yè),我們提供解決方案給他。整個產(chǎn)業(yè)鏈的發(fā)展一定是大家關(guān)注在自己更核心的點上,大家進(jìn)行合作。
我們非常愿意和大家展開這種合作,我們解決的問題是什么呢?我們的攝像頭以前在出廠的時候沒有針對場景進(jìn)行優(yōu)化,后來,我們就開始在數(shù)據(jù)的源頭這一塊做人工智能。根據(jù)這個場景可以優(yōu)化、調(diào)節(jié)前端的抓拍,這樣可以根據(jù)你關(guān)注的目標(biāo),通過最前端這一塊給你做優(yōu)化,這是我們關(guān)注的點。我們只是在嵌入式這個環(huán)節(jié)去用人工智能幫助我們的客戶能夠把前端的圖象非常優(yōu)化、非常清晰地給它抓下來。
以前很多時候并不是我們識別這些算法不好,而是說我們的圖象質(zhì)量有問題。因為它中間還有通過網(wǎng)絡(luò)的傳輸、壓縮,我們希望在那個壓縮之前就把檢測的這些圖象提取出來,這是我們的切入點。所以我們也是非常希望和廣大的廠商一起合作,這是我們的出發(fā)點。
陳治華:商湯在市場上主要是兩大部分,一個部分就是在規(guī)?;瘧?yīng)用,面對集成商這個部分,我們會提供端到端的解決方案,比如說大規(guī)模應(yīng)用上,結(jié)合了我們的人工智能、云計算技術(shù),加上我們的數(shù)據(jù)處理技術(shù),可能提供一個完整的后端解決方案,這是我們在大規(guī)模應(yīng)用上,可以和廣大集成商一起做的事情。
另外一個部分,我們會把這些能力跟廣大的廠商合作,我們在后端會給很多合作伙伴提供一些后臺的引擎。我們可以把高性能的GPU的服務(wù)器和算法結(jié)合好的產(chǎn)品提供給合作伙伴,讓他們在更多的領(lǐng)域做垂直化的應(yīng)用,因為我們不可能做很多的領(lǐng)域,所以我們會在垂直化的領(lǐng)域做一些應(yīng)用。
還有一個是前端的產(chǎn)品,我們也會前置到芯片里面,我們也會開發(fā)出一些FPGA的芯片,提供給一些硬件廠商,比如說不僅僅是在安防領(lǐng)域,可能還在輔助駕駛、機器人等等領(lǐng)域。
程冰:現(xiàn)在AI確實幫助客戶解決了很多的問題,一個是解決了效率的問題,原來我們的客戶要在視頻里面找什么東西,需要大量的人力,包括國內(nèi)一些典型的案件,要花費上百人從視頻里面尋找線索。
第二個是準(zhǔn)確度的提升,在以前我們要辨認(rèn)一個人和另外一個人是不是相似,其實你拿著兩張照片,很難通過人工就辨認(rèn)得清楚。但其實有的時候,機器在這種準(zhǔn)確性上還超過了人眼,它能夠給到你一個相似度的閾值,這個閾值到達(dá)一定程度之后,就可以給人眼一個參考。
第三是在節(jié)省人力方面,例如現(xiàn)在有巡邏機器人、安保機器人,人工智能通過物體檢測、人的檢測,大大節(jié)省了保安的人力和物力。
安洋:剛才各位伙伴也提到了,現(xiàn)在用戶分兩類,一類叫做懂人臉,一類叫做不懂人臉,從儀式上、應(yīng)用上幫助那些沒那么懂人臉的用戶更了解人工智能,這是一個方向。第二個方向是從公安的角度來看,我認(rèn)為它有三個方向要掌握,一是他要知道要保護(hù)哪些人,我們在大城市級的應(yīng)用里面找到好人,二是要知道防范哪些人,這些人我不知道是好人還是壞人,我要把他防起來,三是要打擊壞人,對已經(jīng)知道的壞人我要快速抓捕掉?,F(xiàn)在的發(fā)展階段是倒著來的,我們現(xiàn)在抓了好多壞人,曠視試圖提供這種大的解決方案,幫助他找到哪些需要防范的人,哪些是需要確定保護(hù)的人,這是一個方面。
另外一個方面,現(xiàn)在大面積的人工智能、人臉識別上了之后,對算法和云計算等等廠家來說都是面臨一個巨大的挑戰(zhàn),因為不僅僅是你是億級庫,現(xiàn)在可能已經(jīng)到了千億級的水平,曠視希望基于現(xiàn)有的網(wǎng)絡(luò)和前端計算力把算法前置化,這樣能大規(guī)模的節(jié)省用戶的基礎(chǔ)投資,最快速的見效,讓現(xiàn)有的攝像機和即將上馬的攝像機具有智能化的能力,這是解決他的兩個痛點問題。
第三個問題是隨著計算力的提升,他的硬件成本也在不斷地下降,有了深度學(xué)習(xí)之后,我們的門檻其實是在降低,在這兩個環(huán)境條件下,可以支持用戶更大規(guī)模的去做,這樣能回應(yīng)到我提的第一個問題,就是說在整個城市級、國家級的層面上,我們要知道保護(hù)誰、防范誰、打擊誰。
晉兆龍: 科達(dá)為什么在2014年提出實施前端智能?就是意識到光靠后端智能是無法解決很多問題的,這是一方面。第二方面,我們在端到端的智能解決方案中會碰到很多問題,比如說我們的深度學(xué)習(xí)出來之后,它要凌駕在什么樣的平臺上運行,總是要有一個載體的,這種載體是不是通過通常的載體就能實現(xiàn)?我覺得可能不是很完美的解決,科達(dá)可以推出深度學(xué)習(xí)的計算平臺,跟這個算法做完美的切合。
另外我們隨著深度學(xué)習(xí)發(fā)展之后,它會產(chǎn)生大量的數(shù)據(jù),我們是不是單一的解決這樣一個點的問題?比如說我們是不是只關(guān)注人臉,只關(guān)注車牌,只關(guān)注車型?這些都不是,我們最終從用的角度上來講,我們是要把人、車這些有效的元素用到實際的工作當(dāng)中去,比如說公安行業(yè),最實在的就是案件,我們?nèi)绾伟讶恕④嚭桶讣P(guān)聯(lián),這里面會涉及到一些數(shù)據(jù)的應(yīng)用問題。另外這些數(shù)據(jù)的元素很多,我們需要有專門的方案解決問題,這是從端到端解決問題。
大數(shù)據(jù)出來之后,數(shù)據(jù)是海量的,如何進(jìn)行千億級或者更大規(guī)模的數(shù)據(jù)的碰撞分析,涉及到數(shù)據(jù)的存儲、使用、訪問、快速的檢索。并且公安行業(yè)里面有一個很特殊的存在,就是這些目標(biāo)的快照都是一些小文件,這些半結(jié)構(gòu)化的數(shù)據(jù)都是一些二進(jìn)制的數(shù)據(jù),這都是一些語義數(shù)據(jù),如何把這些元素混雜在一起做綜合的碰撞,綜合分析,這是非常大的挑戰(zhàn)。不光規(guī)模大,而且數(shù)據(jù)種類元素多,所以科達(dá)會提出分布式的數(shù)據(jù)庫,這個數(shù)據(jù)庫會有效地解決問題,最終為了更好地解決問題,這是一個比較系統(tǒng)的東西。
反過來講,我們?nèi)绾蝸頋M足客戶的需求,可能每個點都要做深入的深耕,但是我們覺得更重要的是,你如何全系統(tǒng)地、一系列地從端到端的推出這么一個完整解決方案,每個解決方案都可以解決其中一部分問題。
主持人:如果AI要推動監(jiān)控行業(yè)變革的話,還會遇到哪些困難?簡單的舉一兩個點。
晉兆龍:我覺得AI現(xiàn)在具備了一個大規(guī)模應(yīng)用的基礎(chǔ),這個基礎(chǔ)包含兩部分,一部分就是我們的物質(zhì)基礎(chǔ)已經(jīng)存在了,比如說大規(guī)模的視頻監(jiān)控、算法、各種資源,這是一個物質(zhì)基礎(chǔ)。還有一個是我們的客戶應(yīng)用基礎(chǔ),客戶已經(jīng)對這個東西有深刻的認(rèn)識,并且他認(rèn)為是可以幫助他落地的,我覺得這兩個技術(shù)的存在,對我們推進(jìn)智能化的發(fā)展是至關(guān)重要的。
安洋:談到這個話題,我覺得有兩個方向,一個方向是,現(xiàn)在不管人臉還是結(jié)構(gòu)化,這些信息能夠提高識別率,幫助他解決一個點的問題。能不能解決他真正的業(yè)務(wù)問題,可能未必。比如說在地鐵,在社會面上,是不是我把這個人認(rèn)出來了我就能抓到他?其實不是,我們應(yīng)該在這個方向上跟客戶一起努力打造基于他的人工智能的戰(zhàn)法和部署,實現(xiàn)精準(zhǔn)警務(wù),這是一個方面。
第二個方向是大規(guī)模的應(yīng)用了之后,這些大數(shù)據(jù)應(yīng)該怎么用,它們之間建立的關(guān)系應(yīng)該是什么。很多人抓了車、抓了臉、抓了背影、抓了屁股,這些人、物體怎么連起來,我覺得這也是一個很大的挑戰(zhàn)。
程冰:談瓶頸我覺得還談不上,發(fā)展空間還非常大,困難也是有一些的,像我們從人臉切換到人像特征等等,這個過程中深度學(xué)習(xí)很火,但是數(shù)據(jù)還是非常難,投入成本也非常高,目前也沒有非常好的標(biāo)準(zhǔn),包括國外的測試庫,數(shù)據(jù)量還是非常少的,LFW也就6000多組,所以我們覺得數(shù)據(jù)非常難。
第二個就是在算法的實際的水平和落地的能力上面,我們自身也在做一些服裝、人像的特征,我們還在做一些步態(tài)的識別,我們覺得在這個推廣的過程中確實還是挺困難的,它的準(zhǔn)確度還很難達(dá)到一個客戶想要的水平。就像我們前幾年非?;鸬囊粋€谷歌眼鏡,他們最后也是承認(rèn)了一個錯誤,覺得它推出的時間節(jié)點過早,當(dāng)前客戶想要的更多,這個產(chǎn)品還無法滿足客戶想要的東西。
其實我們在AI上也有這樣的問題,我們覺得很多技術(shù)都開始起步了,其實能落地的技術(shù)確實還要一個過程,客戶的認(rèn)知也有一個過程,太早的推出市場,可能就像10年你去推人臉識別一樣,可能客戶最后直接給你一個閉門羹,認(rèn)為你是騙子。
陳治華:這個問題我的感受比較深刻。第一個部分是難點在算法精度部分,剛才我們也聽到幾位同行在聊算法的門檻低了,但是里面的難點就更多了,也就是精度的部分還有問題。比如說我們今天的人臉布控,我們可能在做1比N(N值在20萬、30萬),商湯正在挑戰(zhàn)N值千萬級的人臉布控,就是我要把人臉做到千萬級,做實時的比對,可能算法的精度差一兩個點,可能就找不到了,這是第一個部分的難點。第二個難點就是抓拍庫的問題,以深圳市局為例,可能是2萬路的建設(shè)規(guī)模,未來是千億級的數(shù)據(jù),就算是熱數(shù)據(jù)三個月,可能也是百萬級以上的數(shù)據(jù)搜索,這個時候精度如果差兩三個點,可能也找不到了。算法精度的提升是永無止境的,這是第一個部分。
第二個部分是我們正在挑戰(zhàn)那些低像素的,它的像素已經(jīng)低到20×20以下,到10×10的情況,這樣一些領(lǐng)域的圖片的還原,比如說我們公安有一些畫像大師,通過一點點的像素能把人像還原出來,商湯正在挑戰(zhàn)這個領(lǐng)域,可能這個像素只有幾個點,但是我往往發(fā)現(xiàn)我跟你認(rèn)識,但是拍得再模糊的照片,我也能大概認(rèn)出是你,目前機器是做不到的,商湯正在挑戰(zhàn)這種超分辨率的技術(shù),在這個方面把他還原出來。
第三個部分,我跟很多公安局聊,往往一些不太明顯的信息是破案的線索,比如說在視頻結(jié)構(gòu)化這個領(lǐng)域,很多邊緣的影像,它反倒會影響破案,這個部分也是算法的挑戰(zhàn),所以我覺得算法挑戰(zhàn)是一個永無止境的話題。
另外一個方面是人工智能的應(yīng)用,剛才我說人工智能的應(yīng)用是把小麥加工成面粉,原來可能是小打小鬧,我們搞幾個機器就夠了,現(xiàn)在一個城市要做幾萬路攝像頭,它的并發(fā)可能是幾百、幾千個并發(fā),這種運算就很驚人了。原來CPU超算中心解決的是文本的數(shù)據(jù),今天面對非結(jié)構(gòu)化的數(shù)據(jù),可能需要GPU的超算中心,商湯自己本身就有4個超算中心,同時我們也在跟一些公安局在建設(shè)GPU超算中心,解決運算的問題。因為要解決幾萬人同時吃面條的問題,如果幾萬人都要吃面條的時候,其實是一個很大的工程問題,我覺得這個問題也是一個巨大的挑戰(zhàn)。
肖洪波:每一項新的技術(shù)出來的時候,我們往往在近期之內(nèi)會高估它的作用,而在長期又忽略它的作用。其實我覺得有一天我們不再談?wù)撊斯ぶ悄艿臅r候,可能那時候就是人工智能真的落地了。剛才晉總說得特別好,人工智能什么時候能可運營化是最重要的。人工智能可運營化之后對你的業(yè)務(wù)會產(chǎn)生很大的影響,你的業(yè)務(wù)流程、職責(zé)設(shè)定甚至新業(yè)務(wù)的形態(tài)都會受到影響。
另外一點,剛才幾位也都提到了,我們算法的發(fā)展還是在不斷向前的,包括深度學(xué)習(xí),其實它的理論現(xiàn)在也沒有特別成熟,還有非常多的新理論出來,我覺得我們大家也會一起努力,把這些人工智能的技術(shù)能夠真正幫助我們的客戶去做一些業(yè)務(wù)方面的創(chuàng)新,這是最重要的。(
10月29日,在CPSE安博會高端訪談的現(xiàn)場,圍繞人工智能和安防等相關(guān)問題進(jìn)行了探討。此次會談由CPS中安網(wǎng)總經(jīng)理楊儒主持,邀請的嘉賓有:觸景無限科技(北京)有限公司CEO肖洪波、商湯科技南區(qū)銷售總監(jiān)陳治華、深圳云天勵飛技術(shù)有限公司產(chǎn)品總監(jiān)程冰、北京曠視科技有限公司解決方案總監(jiān)安洋、蘇州科達(dá)科技股份有限公司智能事業(yè)部總經(jīng)理晉兆龍(以上排名不分先后)。
以下內(nèi)容,在不影響嘉賓意思的語境下,有所更改。
主持人:大家怎么理解AI和安防落地相比其它行業(yè)會更快?
晉兆龍:我們在安防行業(yè)耕耘了很多年,對此有一個深切的體會。從原來傳統(tǒng)的智能算法開始,安防行業(yè)對于智能的需求是非常迫切的,也是一直存在的,只是原來的算法沒法滿足這種高端的需求,包括到現(xiàn)在深度學(xué)習(xí)出來之后,其實還有很多用戶關(guān)于智能方面的應(yīng)用需求還是被壓制的。隨著技術(shù)的前進(jìn),包括我們對行業(yè)應(yīng)用深刻的理解,從數(shù)據(jù)量的爆發(fā)到運算平臺的成熟,到客戶對這個應(yīng)用理解不斷地深入,包括很多現(xiàn)在技術(shù)上無法完美解決的東西,客戶也能通過他自身的不斷認(rèn)識提升,能夠得到一些容忍或者說一些變通的處理方法。
總體上來講,智能或者AI為安防行業(yè)的應(yīng)用賦能了很多東西,從這個角度上來講,加快了智能的發(fā)展和演進(jìn)。同時,本身安防行業(yè)大量的視頻監(jiān)控也具備大數(shù)據(jù)應(yīng)用的基礎(chǔ),我覺得這是兩個相輔相成的促進(jìn)。
安洋:首先為什么人工智能在安防行業(yè)落地很快,我認(rèn)為它有基礎(chǔ),現(xiàn)在全國已經(jīng)有2500萬+的攝像機,這些攝像機都不需要再改造,大部分就可以用來做人臉識別,所以它可以很快的落地,因為它不需要很多的基礎(chǔ)建設(shè)。第二是有需求,原因是現(xiàn)在公安的很多傳統(tǒng)的老三樣的手段,比如說敲門、查身份證、蹲點,這些手段已經(jīng)無效了,所以急需一些基于人臉、基于人形的方法來幫助他提高破案率,所以是有強烈需求的。第三就是技術(shù)的成熟和規(guī)模化的應(yīng)用,現(xiàn)在這么多的攝像機,技術(shù)也成熟到了一定程度,機器視覺的識別率已經(jīng)高于人類的識別率,所以在這種大數(shù)據(jù)的情況下,人工本來就看不過來,機器又比人看得準(zhǔn)。所以我們一直有一個理念,越來越多的攝像機不是給人看的,是給機器看的,而在見效快、有基礎(chǔ)、有需求的情況下,所以AI落地安防很快。
程冰:剛才各位都提到了現(xiàn)在的攝像頭數(shù)非常多,比較適合應(yīng)用人工智能技術(shù),我覺得這是其中一個方面。其實需求是從十幾年前一直都存在的,包括以前大家也有做人臉識別,也有做各種生物識別的,這幾年才非?;稹N覀冇X得有三個方面的因素,第一方面是算法性能的提升,這兩三年做AI的公司基本上都采用深度學(xué)習(xí)的技術(shù),這個技術(shù)比以前的算法提升了10%到20%。第二,我們覺得是算力的提升,包括這幾年的GPU、FPGA這些在計算加速方面得到了大面積的推廣,成本也做得比較低,也便于一些AI公司做數(shù)據(jù)的訓(xùn)練,所以算力也讓技術(shù)得到了快速的進(jìn)步。第三,客戶的認(rèn)知的改變,以前客戶覺得你的準(zhǔn)確性要非常高,大數(shù)據(jù)也是這幾年普及的,我們把AI和大數(shù)據(jù)融合之后,從大數(shù)據(jù)里面能找到目標(biāo)的概率提升,這樣就能幫助客戶解決他切身需要的問題,所以他的認(rèn)知度有一個提升。
陳治華:這件事情我覺得首先要感謝領(lǐng)導(dǎo),他們在很多的大會上都講到人工智能,尤其是在去年6月15號,在百萬公安干警大會上,當(dāng)時都講到了人工智能,我們公安部門應(yīng)該用人工智能手段提升我們的偵查破案的效率,解決當(dāng)前警力不足的問題,這是開啟了大規(guī)模應(yīng)用的一個點,這是我最明確的感受。這個點結(jié)束之后,我再去拜訪公安局的時候就非常受歡迎,他們主動找我跟他們交流,我覺得這是很重要的一個點。包括今年十九大的會議上也提到了人工智能。
另外一點就是算法的突破,這個算法的突破為我們打開了一個瓶頸,深度學(xué)習(xí)為什么這么火?因為它是一種明確的方法,在人工智能領(lǐng)域發(fā)展了幾十年,為什么人工智能一直進(jìn)步很慢,可能就是大家沒有找到打開這個門的鑰匙,這個鑰匙就是深度學(xué)習(xí),商湯在2010年的時候,我們的創(chuàng)始人就用深度學(xué)習(xí)的方法在視覺領(lǐng)域進(jìn)行突破,這是很重要的一點。
還有一點就是算法的提升,其實這種規(guī)模化的應(yīng)用,云計算在公安的落地也就變成可能。今天算法突破之后,它就是一個二進(jìn)制的數(shù)據(jù),就不再是一張張的人臉,它可能是一個數(shù)據(jù)集,這些數(shù)據(jù)集就可以分析和應(yīng)用。因為是數(shù)據(jù),它不再是傳統(tǒng)的非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)是可以分析和利用的,這時候就可以產(chǎn)生很多有意思的事情,比如說布控、檢索、軌跡還原、同型高頻,這都是數(shù)據(jù)應(yīng)用的一種。這么大的應(yīng)用就需要很大的運算能力,所以需要云計算。所以我覺得云計算這樣一個概念在公安的大規(guī)模應(yīng)用,就把安防的產(chǎn)業(yè)有很大的提升,這種大規(guī)模應(yīng)用一定會帶來安防產(chǎn)業(yè)從平安城市到智慧城市的升級,我非??春梦磥碚麄€安防落地的情況。
肖洪波:主要有幾個方面促進(jìn)了現(xiàn)在人工智能的發(fā)展:
一、不僅僅在安防行業(yè),現(xiàn)在很多其他行業(yè)都在做和人工智能的結(jié)合。我記得去年我參加EVS(全球嵌入式智能會議),大家還在討論要不要在前端做人工智能,但今年大家都不討論了,今年討論的是怎么在前端做人工智能。
二、深度學(xué)習(xí)的出現(xiàn),某種程度上降低了圖象算法研究的門檻。我記得我當(dāng)時在UIUC的研究所里面做圖象搜索,大家要定義它的特征,做PCA分析,再做底層的搜索,我們大概花了兩三年的時間,做出來一個覺得還不錯的算法。但是現(xiàn)在你找一個實習(xí)生,他只要有比較好的數(shù)據(jù),他可以很快地做出來比我們當(dāng)時幾個很頂級的博士做出來的效果還要好的模型。所以說它從某種程度上降低了算法進(jìn)入的門檻。
三、算法的提升。2014年,我們和英特爾合作,基于它的平臺做的前端處理,完全可以做到1080P的圖象全幀率的處理,而且功耗在5瓦以內(nèi),它的前端的運算力得到了極大的提升。你只要把這個模型做有效的壓縮和優(yōu)化,你在前端也可以跑得很快。
主持人:大家剛才聊的自己的產(chǎn)品或方案,我們聊具體一點,這些能幫用戶解決哪些場景的問題?能幫他們解決哪些痛點?
肖洪波:我們關(guān)注的主要是在嵌入式這一端,另外我們也是一個中間提供商,我們并不做最終的產(chǎn)品,我們提供的主要是模組的解決方案。所以我們的客戶更多的是攝像頭的企業(yè),我們提供解決方案給他。整個產(chǎn)業(yè)鏈的發(fā)展一定是大家關(guān)注在自己更核心的點上,大家進(jìn)行合作。
我們非常愿意和大家展開這種合作,我們解決的問題是什么呢?我們的攝像頭以前在出廠的時候沒有針對場景進(jìn)行優(yōu)化,后來,我們就開始在數(shù)據(jù)的源頭這一塊做人工智能。根據(jù)這個場景可以優(yōu)化、調(diào)節(jié)前端的抓拍,這樣可以根據(jù)你關(guān)注的目標(biāo),通過最前端這一塊給你做優(yōu)化,這是我們關(guān)注的點。我們只是在嵌入式這個環(huán)節(jié)去用人工智能幫助我們的客戶能夠把前端的圖象非常優(yōu)化、非常清晰地給它抓下來。
以前很多時候并不是我們識別這些算法不好,而是說我們的圖象質(zhì)量有問題。因為它中間還有通過網(wǎng)絡(luò)的傳輸、壓縮,我們希望在那個壓縮之前就把檢測的這些圖象提取出來,這是我們的切入點。所以我們也是非常希望和廣大的廠商一起合作,這是我們的出發(fā)點。
陳治華:商湯在市場上主要是兩大部分,一個部分就是在規(guī)模化應(yīng)用,面對集成商這個部分,我們會提供端到端的解決方案,比如說大規(guī)模應(yīng)用上,結(jié)合了我們的人工智能、云計算技術(shù),加上我們的數(shù)據(jù)處理技術(shù),可能提供一個完整的后端解決方案,這是我們在大規(guī)模應(yīng)用上,可以和廣大集成商一起做的事情。
另外一個部分,我們會把這些能力跟廣大的廠商合作,我們在后端會給很多合作伙伴提供一些后臺的引擎。我們可以把高性能的GPU的服務(wù)器和算法結(jié)合好的產(chǎn)品提供給合作伙伴,讓他們在更多的領(lǐng)域做垂直化的應(yīng)用,因為我們不可能做很多的領(lǐng)域,所以我們會在垂直化的領(lǐng)域做一些應(yīng)用。
還有一個是前端的產(chǎn)品,我們也會前置到芯片里面,我們也會開發(fā)出一些FPGA的芯片,提供給一些硬件廠商,比如說不僅僅是在安防領(lǐng)域,可能還在輔助駕駛、機器人等等領(lǐng)域。
程冰:現(xiàn)在AI確實幫助客戶解決了很多的問題,一個是解決了效率的問題,原來我們的客戶要在視頻里面找什么東西,需要大量的人力,包括國內(nèi)一些典型的案件,要花費上百人從視頻里面尋找線索。
第二個是準(zhǔn)確度的提升,在以前我們要辨認(rèn)一個人和另外一個人是不是相似,其實你拿著兩張照片,很難通過人工就辨認(rèn)得清楚。但其實有的時候,機器在這種準(zhǔn)確性上還超過了人眼,它能夠給到你一個相似度的閾值,這個閾值到達(dá)一定程度之后,就可以給人眼一個參考。
第三是在節(jié)省人力方面,例如現(xiàn)在有巡邏機器人、安保機器人,人工智能通過物體檢測、人的檢測,大大節(jié)省了保安的人力和物力。
安洋:剛才各位伙伴也提到了,現(xiàn)在用戶分兩類,一類叫做懂人臉,一類叫做不懂人臉,從儀式上、應(yīng)用上幫助那些沒那么懂人臉的用戶更了解人工智能,這是一個方向。第二個方向是從公安的角度來看,我認(rèn)為它有三個方向要掌握,一是他要知道要保護(hù)哪些人,我們在大城市級的應(yīng)用里面找到好人,二是要知道防范哪些人,這些人我不知道是好人還是壞人,我要把他防起來,三是要打擊壞人,對已經(jīng)知道的壞人我要快速抓捕掉?,F(xiàn)在的發(fā)展階段是倒著來的,我們現(xiàn)在抓了好多壞人,曠視試圖提供這種大的解決方案,幫助他找到哪些需要防范的人,哪些是需要確定保護(hù)的人,這是一個方面。
另外一個方面,現(xiàn)在大面積的人工智能、人臉識別上了之后,對算法和云計算等等廠家來說都是面臨一個巨大的挑戰(zhàn),因為不僅僅是你是億級庫,現(xiàn)在可能已經(jīng)到了千億級的水平,曠視希望基于現(xiàn)有的網(wǎng)絡(luò)和前端計算力把算法前置化,這樣能大規(guī)模的節(jié)省用戶的基礎(chǔ)投資,最快速的見效,讓現(xiàn)有的攝像機和即將上馬的攝像機具有智能化的能力,這是解決他的兩個痛點問題。
第三個問題是隨著計算力的提升,他的硬件成本也在不斷地下降,有了深度學(xué)習(xí)之后,我們的門檻其實是在降低,在這兩個環(huán)境條件下,可以支持用戶更大規(guī)模的去做,這樣能回應(yīng)到我提的第一個問題,就是說在整個城市級、國家級的層面上,我們要知道保護(hù)誰、防范誰、打擊誰。
晉兆龍: 科達(dá)為什么在2014年提出實施前端智能?就是意識到光靠后端智能是無法解決很多問題的,這是一方面。第二方面,我們在端到端的智能解決方案中會碰到很多問題,比如說我們的深度學(xué)習(xí)出來之后,它要凌駕在什么樣的平臺上運行,總是要有一個載體的,這種載體是不是通過通常的載體就能實現(xiàn)?我覺得可能不是很完美的解決,科達(dá)可以推出深度學(xué)習(xí)的計算平臺,跟這個算法做完美的切合。
另外我們隨著深度學(xué)習(xí)發(fā)展之后,它會產(chǎn)生大量的數(shù)據(jù),我們是不是單一的解決這樣一個點的問題?比如說我們是不是只關(guān)注人臉,只關(guān)注車牌,只關(guān)注車型?這些都不是,我們最終從用的角度上來講,我們是要把人、車這些有效的元素用到實際的工作當(dāng)中去,比如說公安行業(yè),最實在的就是案件,我們?nèi)绾伟讶?、車和案件關(guān)聯(lián),這里面會涉及到一些數(shù)據(jù)的應(yīng)用問題。另外這些數(shù)據(jù)的元素很多,我們需要有專門的方案解決問題,這是從端到端解決問題。
大數(shù)據(jù)出來之后,數(shù)據(jù)是海量的,如何進(jìn)行千億級或者更大規(guī)模的數(shù)據(jù)的碰撞分析,涉及到數(shù)據(jù)的存儲、使用、訪問、快速的檢索。并且公安行業(yè)里面有一個很特殊的存在,就是這些目標(biāo)的快照都是一些小文件,這些半結(jié)構(gòu)化的數(shù)據(jù)都是一些二進(jìn)制的數(shù)據(jù),這都是一些語義數(shù)據(jù),如何把這些元素混雜在一起做綜合的碰撞,綜合分析,這是非常大的挑戰(zhàn)。不光規(guī)模大,而且數(shù)據(jù)種類元素多,所以科達(dá)會提出分布式的數(shù)據(jù)庫,這個數(shù)據(jù)庫會有效地解決問題,最終為了更好地解決問題,這是一個比較系統(tǒng)的東西。
反過來講,我們?nèi)绾蝸頋M足客戶的需求,可能每個點都要做深入的深耕,但是我們覺得更重要的是,你如何全系統(tǒng)地、一系列地從端到端的推出這么一個完整解決方案,每個解決方案都可以解決其中一部分問題。
主持人:如果AI要推動監(jiān)控行業(yè)變革的話,還會遇到哪些困難?簡單的舉一兩個點。
晉兆龍:我覺得AI現(xiàn)在具備了一個大規(guī)模應(yīng)用的基礎(chǔ),這個基礎(chǔ)包含兩部分,一部分就是我們的物質(zhì)基礎(chǔ)已經(jīng)存在了,比如說大規(guī)模的視頻監(jiān)控、算法、各種資源,這是一個物質(zhì)基礎(chǔ)。還有一個是我們的客戶應(yīng)用基礎(chǔ),客戶已經(jīng)對這個東西有深刻的認(rèn)識,并且他認(rèn)為是可以幫助他落地的,我覺得這兩個技術(shù)的存在,對我們推進(jìn)智能化的發(fā)展是至關(guān)重要的。
安洋:談到這個話題,我覺得有兩個方向,一個方向是,現(xiàn)在不管人臉還是結(jié)構(gòu)化,這些信息能夠提高識別率,幫助他解決一個點的問題。能不能解決他真正的業(yè)務(wù)問題,可能未必。比如說在地鐵,在社會面上,是不是我把這個人認(rèn)出來了我就能抓到他?其實不是,我們應(yīng)該在這個方向上跟客戶一起努力打造基于他的人工智能的戰(zhàn)法和部署,實現(xiàn)精準(zhǔn)警務(wù),這是一個方面。
第二個方向是大規(guī)模的應(yīng)用了之后,這些大數(shù)據(jù)應(yīng)該怎么用,它們之間建立的關(guān)系應(yīng)該是什么。很多人抓了車、抓了臉、抓了背影、抓了屁股,這些人、物體怎么連起來,我覺得這也是一個很大的挑戰(zhàn)。
程冰:談瓶頸我覺得還談不上,發(fā)展空間還非常大,困難也是有一些的,像我們從人臉切換到人像特征等等,這個過程中深度學(xué)習(xí)很火,但是數(shù)據(jù)還是非常難,投入成本也非常高,目前也沒有非常好的標(biāo)準(zhǔn),包括國外的測試庫,數(shù)據(jù)量還是非常少的,LFW也就6000多組,所以我們覺得數(shù)據(jù)非常難。
第二個就是在算法的實際的水平和落地的能力上面,我們自身也在做一些服裝、人像的特征,我們還在做一些步態(tài)的識別,我們覺得在這個推廣的過程中確實還是挺困難的,它的準(zhǔn)確度還很難達(dá)到一個客戶想要的水平。就像我們前幾年非?;鸬囊粋€谷歌眼鏡,他們最后也是承認(rèn)了一個錯誤,覺得它推出的時間節(jié)點過早,當(dāng)前客戶想要的更多,這個產(chǎn)品還無法滿足客戶想要的東西。
其實我們在AI上也有這樣的問題,我們覺得很多技術(shù)都開始起步了,其實能落地的技術(shù)確實還要一個過程,客戶的認(rèn)知也有一個過程,太早的推出市場,可能就像10年你去推人臉識別一樣,可能客戶最后直接給你一個閉門羹,認(rèn)為你是騙子。
陳治華:這個問題我的感受比較深刻。第一個部分是難點在算法精度部分,剛才我們也聽到幾位同行在聊算法的門檻低了,但是里面的難點就更多了,也就是精度的部分還有問題。比如說我們今天的人臉布控,我們可能在做1比N(N值在20萬、30萬),商湯正在挑戰(zhàn)N值千萬級的人臉布控,就是我要把人臉做到千萬級,做實時的比對,可能算法的精度差一兩個點,可能就找不到了,這是第一個部分的難點。第二個難點就是抓拍庫的問題,以深圳市局為例,可能是2萬路的建設(shè)規(guī)模,未來是千億級的數(shù)據(jù),就算是熱數(shù)據(jù)三個月,可能也是百萬級以上的數(shù)據(jù)搜索,這個時候精度如果差兩三個點,可能也找不到了。算法精度的提升是永無止境的,這是第一個部分。
第二個部分是我們正在挑戰(zhàn)那些低像素的,它的像素已經(jīng)低到20×20以下,到10×10的情況,這樣一些領(lǐng)域的圖片的還原,比如說我們公安有一些畫像大師,通過一點點的像素能把人像還原出來,商湯正在挑戰(zhàn)這個領(lǐng)域,可能這個像素只有幾個點,但是我往往發(fā)現(xiàn)我跟你認(rèn)識,但是拍得再模糊的照片,我也能大概認(rèn)出是你,目前機器是做不到的,商湯正在挑戰(zhàn)這種超分辨率的技術(shù),在這個方面把他還原出來。
第三個部分,我跟很多公安局聊,往往一些不太明顯的信息是破案的線索,比如說在視頻結(jié)構(gòu)化這個領(lǐng)域,很多邊緣的影像,它反倒會影響破案,這個部分也是算法的挑戰(zhàn),所以我覺得算法挑戰(zhàn)是一個永無止境的話題。
另外一個方面是人工智能的應(yīng)用,剛才我說人工智能的應(yīng)用是把小麥加工成面粉,原來可能是小打小鬧,我們搞幾個機器就夠了,現(xiàn)在一個城市要做幾萬路攝像頭,它的并發(fā)可能是幾百、幾千個并發(fā),這種運算就很驚人了。原來CPU超算中心解決的是文本的數(shù)據(jù),今天面對非結(jié)構(gòu)化的數(shù)據(jù),可能需要GPU的超算中心,商湯自己本身就有4個超算中心,同時我們也在跟一些公安局在建設(shè)GPU超算中心,解決運算的問題。因為要解決幾萬人同時吃面條的問題,如果幾萬人都要吃面條的時候,其實是一個很大的工程問題,我覺得這個問題也是一個巨大的挑戰(zhàn)。
肖洪波:每一項新的技術(shù)出來的時候,我們往往在近期之內(nèi)會高估它的作用,而在長期又忽略它的作用。其實我覺得有一天我們不再談?wù)撊斯ぶ悄艿臅r候,可能那時候就是人工智能真的落地了。剛才晉總說得特別好,人工智能什么時候能可運營化是最重要的。人工智能可運營化之后對你的業(yè)務(wù)會產(chǎn)生很大的影響,你的業(yè)務(wù)流程、職責(zé)設(shè)定甚至新業(yè)務(wù)的形態(tài)都會受到影響。
另外一點,剛才幾位也都提到了,我們算法的發(fā)展還是在不斷向前的,包括深度學(xué)習(xí),其實它的理論現(xiàn)在也沒有特別成熟,還有非常多的新理論出來,我覺得我們大家也會一起努力,把這些人工智能的技術(shù)能夠真正幫助我們的客戶去做一些業(yè)務(wù)方面的創(chuàng)新,這是最重要的。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 高燃直擊2024世界智能制造博覽會!譜寫智能制造領(lǐng)域全新篇章
- 中泰文化交流新篇章:賽氪與寰宇播客營聯(lián)合中南財經(jīng)政法大學(xué)及多方舉辦泰國留學(xué)生交流活動
- 2025醫(yī)藥數(shù)智營銷創(chuàng)新峰會“金創(chuàng)獎”獎項申報啟動!
- 2024第五屆亞太銀行數(shù)字化創(chuàng)新大會圓滿落幕
- 2024年被稱為“低空經(jīng)濟元年”!倒計時15天 | 2025中國eVTOL創(chuàng)新發(fā)展大會報名中
- 匯聚技術(shù)星火 點亮生態(tài)星空
- GTF2025攜航空和燃?xì)廨啓C全產(chǎn)業(yè)鏈優(yōu)勢資源全新回歸上海
- 潮玩風(fēng)暴來襲,2025 ChinaJoy 潮玩手辦及模型展區(qū)招商火爆!
- 普渡機器人發(fā)布首款全人形機器人PUDU D9
- 【創(chuàng)新金融驅(qū)動力】2025中原金融科技節(jié)擘畫中原金融科技新未來!
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。