作者:苑維然
下面介紹如何開(kāi)始一個(gè)AI業(yè)務(wù),這是一次比較科普的演講,希望通過(guò)計(jì)算機(jī)視覺(jué)的一些案例,能帶給在座的各位EGO會(huì)員及各行業(yè)的老板一個(gè)關(guān)于AI和自己的業(yè)務(wù)結(jié)合的直觀的認(rèn)識(shí)。
這里我先簡(jiǎn)單介紹一下計(jì)算機(jī)視覺(jué)做的事情是什么,然后再給大家引申一下,在一些業(yè)務(wù)里應(yīng)用這些技術(shù)的可能性。
這個(gè)圖是我今天早上臨時(shí)加上的,我覺(jué)得這樣畫(huà)應(yīng)該更容易理解一些。計(jì)算機(jī)視覺(jué)的任務(wù)就是要對(duì)幾種和視覺(jué)相關(guān)的媒體做一些信息處理,包括圖片、視頻以及深度視頻。
通過(guò)這些媒體我們得到的對(duì)象包括人臉、人體、車(chē)以及其他,這里其他對(duì)象的范圍比較廣泛,比如說(shuō)寵物、食品、普通物體分類(lèi)等等,但是它的應(yīng)用范圍應(yīng)該遠(yuǎn)不如前三者。
得到了這些對(duì)象的圖像信息之后,我們要做什么任務(wù)呢?總結(jié)一下,比較廣泛應(yīng)用的有兩種任務(wù),一是結(jié)構(gòu)化,二是圖搜。
結(jié)構(gòu)化是指這個(gè)對(duì)象確切可描述的信息。比如一張人臉圖片的結(jié)構(gòu)化信息包括人的性別、年齡、表情類(lèi)別,以及戴不戴眼鏡、口罩、帽子等信息;人體的結(jié)構(gòu)化包括人的上身下身的衣著特點(diǎn)等;車(chē)輛的結(jié)構(gòu)化信息就比較多了,基本的有車(chē)牌、車(chē)型、年款、顏色等,另外有一些可以描述的特征信息,比如車(chē)窗內(nèi)掛件、擺件,甚至是否有劃痕等等,這些特征描述對(duì)于區(qū)分一些很像的車(chē)是非常有用的。
然后是圖搜,圖搜的信息基礎(chǔ)是沒(méi)有結(jié)構(gòu)化描述的,計(jì)算得到的是一個(gè)特征。我們常談到的人臉識(shí)別就是典型的圖搜應(yīng)用,最典型的1:N人臉?biāo)阉骶褪且砸粡埬標(biāo)褕D庫(kù)里的臉,得到和它距離很近的一些臉。人體和車(chē)也是一樣,只不過(guò)人體和車(chē)輛的特征維度相對(duì)于人臉來(lái)講少一些,這決定了人臉?biāo)阉骺梢栽谝粋€(gè)更大的庫(kù)中發(fā)生,人體和車(chē)輛只能在相對(duì)小的庫(kù)中搜索。
對(duì)于結(jié)構(gòu)化和圖搜這兩種任務(wù)來(lái)講,圖搜具有更廣泛的應(yīng)用場(chǎng)景,為什么呢?得到結(jié)構(gòu)化信息之后,通常是作為數(shù)據(jù)庫(kù)索引進(jìn)行搜索,但是具體應(yīng)用中很難單純依賴(lài)結(jié)構(gòu)化信息得到想找的對(duì)象。比如要找一個(gè)人,很難通過(guò)具體描述這個(gè)人是長(zhǎng)頭發(fā)、有胡須、戴眼鏡或者其他可描述的細(xì)節(jié)直接找到這個(gè)人,但是如果提供一張這個(gè)人的照片,就可以在人臉庫(kù)里很好地搜索到。車(chē)也是一樣,我們通常通過(guò)車(chē)牌來(lái)搜索一個(gè)車(chē),但是在真正的應(yīng)用場(chǎng)景里,這是不一定生效的。比如一些犯罪分子在辦案時(shí)往往會(huì)把車(chē)牌隱藏掉,或者干脆用一個(gè)假車(chē)牌,這時(shí)候就需要用車(chē)的特征來(lái)搜索,這樣的場(chǎng)景下技術(shù)帶來(lái)了真正可用的價(jià)值。
這張圖再往后,是計(jì)算的平臺(tái)或載體。
首先是云服務(wù)的應(yīng)用,這在公安這類(lèi)機(jī)密客戶(hù)那里是遠(yuǎn)遠(yuǎn)落后于商業(yè)及個(gè)人用戶(hù)的。我們?nèi)ツ杲?jīng)常做這樣的事情,就是把一堆服務(wù)器搬到用戶(hù)的機(jī)房里,比如警方或者交管局,我們留下專(zhuān)人運(yùn)維這個(gè)機(jī)房里的服務(wù)器,我們連接客戶(hù)的視頻流,利用CPU和GPU去計(jì)算前面所所說(shuō)的東西,然后把結(jié)果在它的客戶(hù)端體現(xiàn)出來(lái),或者是推送到客戶(hù)的平臺(tái)中。
但從今年開(kāi)始我們有一些新的東西受到了老客戶(hù)的青睞,對(duì)于類(lèi)似于公安或交通這樣的傳統(tǒng)用戶(hù),他們竟然也或多或少的接受云端的方案,這在以往是不可想象的,因?yàn)樗麄兊募夹g(shù)和數(shù)據(jù)是非常機(jī)密的。但是現(xiàn)在一些云服務(wù)提供商針對(duì)公安、銀行這些具體的業(yè)務(wù)做了大量專(zhuān)用網(wǎng)絡(luò)和安全上的優(yōu)化工作,使得這個(gè)事可以發(fā)生。
另一方面就是越來(lái)越多地使用了EDGE端的計(jì)算,端到端(EDGE端到CLOUD端)已經(jīng)不再是什么秘密,一個(gè)很直接的結(jié)果就是降低了成本、提高了密度、以及廣泛的智能化。舉個(gè)例子,原來(lái)的IPC(網(wǎng)絡(luò)攝像機(jī))都是傳視頻到后端去處理,現(xiàn)在很多專(zhuān)門(mén)的車(chē)輛及人臉抓拍攝像機(jī)可以在終端設(shè)備上把我們關(guān)注的對(duì)象抓拍成圖片,再把圖片傳到后端去處理,一方面是節(jié)省帶寬,原來(lái)一個(gè)Gb的帶寬只能傳輸幾十路視頻,現(xiàn)在只傳輸抓拍圖片可以做到萬(wàn)路,更令人激動(dòng)的是,假如抓拍設(shè)備部署在普通的超市、飯店這樣的街頭小店里,使用非常便宜和普通的家用帶寬就可以滿(mǎn)足要求。另外一個(gè)好處是后端服務(wù)器的計(jì)算成本極大降低,可能降低兩個(gè)數(shù)量級(jí)這樣的程度。兩個(gè)數(shù)量級(jí)大家可以想象是什么樣的情況,我們可以把一個(gè)應(yīng)用做到非常便宜,可以從原來(lái)2G的業(yè)務(wù)逐漸做到2B的業(yè)務(wù),再逐漸做到2C的業(yè)務(wù)。目前零售行業(yè)以及一些智能辦公行業(yè)已經(jīng)在嘗試這樣的業(yè)務(wù)方式,總結(jié)一下,就是我經(jīng)常在公司和客戶(hù)那里說(shuō)的三個(gè)詞:低成本、高密度、智能化。這是從業(yè)務(wù)上來(lái)分析計(jì)算機(jī)視覺(jué)的一些情況。
這里邊有幾個(gè)事情我需要說(shuō)明一下。第一個(gè)是深度視頻,深度視頻相關(guān)的產(chǎn)品我們?cè)谒哪昵熬烷_(kāi)始做,我不否認(rèn)它的科技范兒,以及在一些場(chǎng)景里它不可替代的作用,但是到現(xiàn)在為止還是一個(gè)成本比較高的產(chǎn)品,所以它大都應(yīng)用在類(lèi)似于銀行加鈔、金庫(kù)、監(jiān)獄等支付能力非常強(qiáng)的客戶(hù)。深度視頻的作用顯而易見(jiàn),通過(guò)深度數(shù)據(jù),它很容易能夠計(jì)算出人的肢體行為、行動(dòng)、人和環(huán)境關(guān)系等信息,而普通二維數(shù)據(jù)很難做到。這個(gè)產(chǎn)品目前還不具備廣泛場(chǎng)景的擴(kuò)展性,但是隨著傳感器技術(shù)的提高,事實(shí)上我們已經(jīng)看到一些這方面的成果,它也會(huì)滿(mǎn)足前邊提到的低成本、高密度、智能化的原則。
另一個(gè)要說(shuō)明的是視頻,這就是剛才講的,逐漸會(huì)把后端視頻的處理轉(zhuǎn)移為前端抓拍之后在后端對(duì)圖片的處理,這樣降低了兩個(gè)數(shù)量級(jí)的成本之后,最大范圍地進(jìn)行業(yè)務(wù)的推廣。大家可能很奇怪,之前GPU的勢(shì)頭很猛,NVidia的股價(jià)在一年時(shí)間里飆升了三倍不止。但是我想說(shuō)的是 NVidia工業(yè)級(jí)別的顯卡價(jià)格和CPU這樣的市場(chǎng)相比是小眾和暴利的。CPU是個(gè)2C的市場(chǎng),GPU也有2C的市場(chǎng),但是工業(yè)級(jí)別的GPU顯卡,它的市場(chǎng)價(jià)格是普通顯卡的幾倍。之所以能維持高價(jià),是因?yàn)橹吧儆刑娲?,然而我們今天看?lái)它的優(yōu)勢(shì)越來(lái)越小。
一方面,現(xiàn)在有很多算法上的進(jìn)展告訴我們,同樣的算法在CPU上也可以高度的優(yōu)化,它的成本和在GPU上可以媲美。而結(jié)合CPU服務(wù)器的穩(wěn)定性和靈活性,比如分鐘級(jí)別的彈性調(diào)度,它的實(shí)際成本還有一個(gè)數(shù)量級(jí)的優(yōu)化空間。
另一方面,它的競(jìng)爭(zhēng)對(duì)手還包括ARM、FPGA、 Google的TPU芯片等這些日益成熟的專(zhuān)有計(jì)算芯片。這樣的結(jié)果告訴我們,我們以前好像做錯(cuò)了,我們建立了大量的GPU集群,某個(gè)友商甚至利用它上一輪融資的千萬(wàn)美金建立了一個(gè)幾千塊GPU的私有計(jì)算集群。但是大家往后看,這可能不是特別值得,我感覺(jué)一兩年內(nèi)就會(huì)發(fā)生的是,首先GPU的價(jià)格會(huì)降低到非常親民,專(zhuān)有計(jì)算芯片無(wú)論在服務(wù)器端還是在輕量級(jí)設(shè)備端都普及。
這個(gè)圖是一個(gè)人臉系統(tǒng)的業(yè)務(wù)模型,左邊是終端設(shè)備,是我們系統(tǒng)的數(shù)據(jù)源,基本都是抓拍設(shè)備,包括我們自己造的人臉抓拍機(jī),以及我們自己造的人眼相機(jī)。人眼相機(jī)是可以應(yīng)用于大廣場(chǎng)、大范圍的人臉抓拍機(jī)。另外還有抓拍服務(wù)器,對(duì)接普通的IPC,通過(guò)這個(gè)抓拍服務(wù)器可以把普通的IPC變成抓拍機(jī)一樣的形態(tài)來(lái)對(duì)接系統(tǒng)。中間系統(tǒng)上下兩個(gè)藍(lán)色的數(shù)據(jù)流,下面的數(shù)據(jù)流是實(shí)時(shí)業(yè)務(wù)流,上面是像黑白名單入庫(kù)之類(lèi)的離線(xiàn)業(yè)務(wù)流。視頻數(shù)據(jù)由抓拍設(shè)備轉(zhuǎn)換成圖片之后會(huì)經(jīng)過(guò)人臉引擎進(jìn)行處理,這個(gè)大規(guī)模的引擎包括人臉檢測(cè)、特征提取和結(jié)構(gòu)化,對(duì)于車(chē)的數(shù)據(jù)也類(lèi)似地會(huì)有相應(yīng)的車(chē)輛檢測(cè)和結(jié)構(gòu)化,然后經(jīng)過(guò)存儲(chǔ)、比對(duì)引擎和消息隊(duì)列,形成我們的一套系統(tǒng),后面對(duì)接應(yīng)用的API池。上面還有一個(gè)從數(shù)據(jù)庫(kù)對(duì)接出的離線(xiàn)數(shù)據(jù)分析和實(shí)時(shí)數(shù)據(jù)分析系統(tǒng),它結(jié)合其他平臺(tái)的業(yè)務(wù)數(shù)據(jù),對(duì)結(jié)構(gòu)化數(shù)據(jù)和比對(duì)結(jié)果進(jìn)行大數(shù)據(jù)分析,并匯集到一個(gè)多維查詢(xún)系統(tǒng)。
每個(gè)行業(yè)都有它自己不好做的地方,AI這個(gè)細(xì)分行業(yè)里最大的特點(diǎn)就是數(shù)據(jù)依賴(lài)。大家可能都知道AI算法基本上都是以基于學(xué)習(xí)的算法為主,簡(jiǎn)單的講就是通過(guò)大量的數(shù)據(jù)標(biāo)注之后(Data),對(duì)一個(gè)網(wǎng)絡(luò)(Network)的參數(shù)進(jìn)行迭代優(yōu)化得到一個(gè)模型(Model),業(yè)務(wù)層通過(guò)這個(gè)Model進(jìn)行推理計(jì)算。我這個(gè)題目叫“如何開(kāi)始一個(gè)AI業(yè)務(wù)”,當(dāng)你在自己的業(yè)務(wù)上考慮這個(gè)問(wèn)題的時(shí)候,你要用AI解決什么問(wèn)題,首先要問(wèn)自己數(shù)據(jù)夠不夠,第一是量夠不夠,第二是質(zhì)量夠不夠,第三是數(shù)據(jù)的多樣性夠不夠,量和質(zhì)量比較好理解,下面講一下多樣性的問(wèn)題,也就是跨域數(shù)據(jù)的難題。
多樣性
以人臉識(shí)別這個(gè)業(yè)務(wù)為例,有一些公共的人臉平臺(tái),可以輸入一張照片和一個(gè)庫(kù),它會(huì)給出識(shí)別結(jié)果。但是據(jù)我了解,這些通用的人臉平臺(tái)在具體業(yè)務(wù)上表現(xiàn)并令人滿(mǎn)意。我是非常理解他們的,為什么幾個(gè)友商都說(shuō)自己是人臉識(shí)別第一的平臺(tái),但是在具體應(yīng)用時(shí)表現(xiàn)不好呢,答案是它的數(shù)據(jù)并沒(méi)有符合你使用的域。
舉個(gè)例子,一個(gè)做婚戀網(wǎng)站,它數(shù)據(jù)庫(kù)里的照片都是經(jīng)過(guò)化裝打扮的;一個(gè)社交網(wǎng)站,它的人臉頭像數(shù)據(jù)都是個(gè)性搞怪的;而我們的身份證照片,則是普通素顏的。這幾個(gè)領(lǐng)域里的數(shù)據(jù),領(lǐng)域內(nèi)是非常好用的,但是它們相互之間的交叉聯(lián)系,無(wú)論從數(shù)據(jù)獲取、標(biāo)注還是得到最終應(yīng)用結(jié)果,都是非常困難的。我們之前在某個(gè)邊疆省份做了一個(gè)業(yè)務(wù),模式很簡(jiǎn)單,就是用人臉識(shí)別跑一個(gè)黑名單,黑名單里包括公安關(guān)注的危險(xiǎn)分子,這個(gè)名單非常大,大概有幾十萬(wàn)。在最開(kāi)始實(shí)施現(xiàn)場(chǎng)測(cè)試的時(shí)候,我們發(fā)現(xiàn)結(jié)果非常不好,準(zhǔn)確度并沒(méi)有達(dá)到我們的期望。后來(lái)我們發(fā)現(xiàn)這個(gè)省的大多是少數(shù)民族,他們的臉跟漢族人特征差異很大,而跟西亞人或者是俄羅斯人種是更像的,而我們那時(shí)候的人臉模型,還是以漢族人為主要的樣本訓(xùn)練得到的,所以帶來(lái)了很大的困難,其根本原因還是樣本數(shù)據(jù)量不足造成的。所以在我們把現(xiàn)場(chǎng)數(shù)據(jù)標(biāo)注和重新訓(xùn)練作為項(xiàng)目本身的過(guò)程,很快就達(dá)到了我們期望的準(zhǔn)確度。
只有深入理解應(yīng)用數(shù)據(jù)的域,才能夠得到期望的效果。另外一種情況是希望有跨域數(shù)據(jù)的應(yīng)用,比如證件照和各種現(xiàn)場(chǎng)抓拍照的跨域,就必須專(zhuān)門(mén)針對(duì)跨域的問(wèn)題進(jìn)行交叉的標(biāo)注和訓(xùn)練,才能得到好的結(jié)果??缬虻某杀就Q于數(shù)據(jù)的來(lái)源,比如刷身份證并抓拍人臉的門(mén)禁,就可以很好的把證件照和抓拍照聯(lián)系起來(lái)。
另外一個(gè)與數(shù)據(jù)相關(guān)的就是如何在業(yè)務(wù)中結(jié)合標(biāo)注。所謂標(biāo)注,大家可以理解為人工智能里的“人工”。一個(gè)已經(jīng)使用舊數(shù)據(jù)訓(xùn)練好的模型在你的領(lǐng)域里可能不一定適用,必須把標(biāo)注的任務(wù)融入到業(yè)務(wù)里,讓它成為業(yè)務(wù)的常態(tài)。做電商一定會(huì)有個(gè)呼叫中心,做AI也一定會(huì)有個(gè)標(biāo)注中心支撐我們的業(yè)務(wù),他們就會(huì)根據(jù)我們?nèi)蝿?wù)的指標(biāo)去完成標(biāo)注的任務(wù)。經(jīng)過(guò)標(biāo)注中心標(biāo)注之后,AI模型的效果會(huì)逐漸變好。所以當(dāng)你考慮這樣的業(yè)務(wù)一定要同時(shí)考慮相關(guān)的人工成本,如果領(lǐng)域不變的話(huà),成本可能會(huì)逐漸降低,需要標(biāo)注的數(shù)據(jù)會(huì)逐漸變少,但是可能不會(huì)消失,因?yàn)闀r(shí)過(guò)境遷,總會(huì)有些變化的東西。
ID,ID,ID,重要的事情說(shuō)三遍,在AI業(yè)務(wù)里,我們認(rèn)為能得到的最有價(jià)值的信息就是ID。我把它分成了幾種層次:
第一種就是類(lèi)似于身份證這樣的ID,它不一定是身份證,但一定是長(zhǎng)效、唯一的ID,這是最有價(jià)值的,就像你在網(wǎng)上做什么事都有記錄一樣,如果我有這個(gè)ID,而以后你在現(xiàn)實(shí)中做什么事也都有紀(jì)錄,這是很可怕的事情。
第二種就是長(zhǎng)ID,長(zhǎng)ID是跨域的,跨時(shí)間、跨地點(diǎn)、跨來(lái)源,長(zhǎng)ID并不能知道你是張三還是李四,但是它知道這個(gè)ID之前所有的活動(dòng)。我們把能夠拼接形成長(zhǎng)ID的計(jì)算過(guò)程叫ReID,就是你很多活動(dòng)我們通過(guò)算法把它們連接在一起了。
在商場(chǎng)里,當(dāng)你進(jìn)入的時(shí)候,如果獲得了你得長(zhǎng)ID,系統(tǒng)雖然不知道你是誰(shuí),但是能瞬間調(diào)出你之前進(jìn)入商店的行為,包括你在哪個(gè)柜臺(tái)前逗留時(shí)間長(zhǎng),你的動(dòng)線(xiàn)軌跡,甚至可以綁定了你的結(jié)帳信息,知道你購(gòu)買(mǎi)的記錄。對(duì)于商店的應(yīng)用來(lái)講,這些數(shù)據(jù)已經(jīng)足夠了,這樣的一個(gè)長(zhǎng)ID獲取成本低而且規(guī)避了侵犯隱私風(fēng)險(xiǎn),一個(gè)商場(chǎng)顯然不可能對(duì)你的身份信息進(jìn)行核實(shí),但是它有這樣的長(zhǎng)ID,就有足夠的想象空間做出一些營(yíng)銷(xiāo)上的優(yōu)化。短ID,就是一個(gè)在時(shí)空上局部的ID。ID的價(jià)值從上到下是遞減的,當(dāng)然獲取成本也是越來(lái)越小。ID的密度和分布也是非常重要的,就像網(wǎng)站的瀏覽記錄,得到的ID密度越高,對(duì)用戶(hù)行為了解得更透徹,這里有很多細(xì)節(jié)。包括我是只得到你在這的活動(dòng),還是說(shuō)得到你非常大范圍的活動(dòng)。這些就是我對(duì)ID的一個(gè)分類(lèi)定義。
這里總結(jié)了一下以人臉識(shí)別或者車(chē)輛識(shí)別技術(shù)為基礎(chǔ)的應(yīng)用,本質(zhì)上是ID的關(guān)系。所有我們需要得到的結(jié)果都是這幾個(gè)ID的關(guān)系,車(chē)輛、模糊的車(chē)輛、清晰的車(chē)輛、人臉、人體、手機(jī),或者沒(méi)有寫(xiě)進(jìn)來(lái)的其他的東西。
在應(yīng)用里,我們希望它們之間都有ID對(duì)應(yīng),同一類(lèi)對(duì)象,比如人臉和人臉之間,進(jìn)行比對(duì)之后,就知道兩個(gè)人臉是不是同一個(gè)人的概率,如果是同一個(gè)人,再把兩個(gè)ID合并,其他的也是一樣。但是當(dāng)我關(guān)注下面這樣的事的時(shí)候,就不一樣了。一個(gè)人開(kāi)了車(chē),然后從這個(gè)車(chē)上下來(lái),這個(gè)時(shí)候,我作為一個(gè)人很容易知道這個(gè)車(chē)是他的車(chē),他是司機(jī)也好,他是副駕駛也好,這個(gè)關(guān)系我知道,但是人工智能很難處理這樣的事情,它需要通過(guò)一些邏輯上的分析以及一些模糊的匹配去得到這樣的關(guān)系。
比如圖中橫向的,車(chē)輛和人臉之間的關(guān)系,模糊車(chē)輛和清晰車(chē)輛之間的關(guān)系,模糊車(chē)輛就是看不清楚車(chē)牌,但是大概能看清這個(gè)車(chē),清晰車(chē)輛就是車(chē)牌能看得更清楚一些。我們會(huì)通過(guò)一些模糊匹配的方式以及時(shí)空關(guān)系等方式把它們匹配起來(lái)。包括人臉和人體也是一樣,能看清這張臉,但是當(dāng)其他任何拍這個(gè)人拍得比較小的時(shí)候,這張臉看不清楚了,我怎么知道這個(gè)人還是你,這也是一個(gè)要打通的關(guān)系。人體和手機(jī)更是這樣。當(dāng)我們把橫向和縱向的關(guān)系都打通, ID全部的關(guān)系就通了?,F(xiàn)在我的圖中打問(wèn)號(hào)的這幾個(gè)地方,實(shí)際上是目前做得并不好的地方,這也是人工智能相關(guān)的應(yīng)用在近幾年要特別加強(qiáng),也是最有機(jī)會(huì)的地方。
你的業(yè)務(wù)需要AI/CV嗎?
我接受過(guò)很多的公司來(lái)向我們咨詢(xún)方案,想要他們的業(yè)務(wù)里獲得AI的能力,用來(lái)幫助他們的業(yè)務(wù)進(jìn)行優(yōu)化和轉(zhuǎn)型。在實(shí)際項(xiàng)目中我也接觸了幾個(gè)行業(yè),我們也做了一些產(chǎn)品去應(yīng)用于不同行業(yè)。
圖中列的幾個(gè)行業(yè)有這樣的一些關(guān)系,首先從公安業(yè)務(wù)說(shuō)起,它的特點(diǎn)就是2G,主要的業(yè)務(wù)目標(biāo)是公安稽查、布控,就是剛才講的動(dòng)態(tài)黑名單布控、靜態(tài)圖幀這樣的一些業(yè)務(wù),這個(gè)業(yè)務(wù)做了幾年。說(shuō)實(shí)話(huà),這是我們的衣食父母,到現(xiàn)在公安業(yè)務(wù)也是整個(gè)人工智能行業(yè)最現(xiàn)實(shí)的一個(gè)業(yè)務(wù)方向。以公安業(yè)務(wù)的技術(shù)、產(chǎn)品為基礎(chǔ),我們發(fā)現(xiàn)可以做很多新的東西,比如說(shuō)智能辦公,樓宇和室內(nèi)顯然比公共場(chǎng)所的業(yè)務(wù)量級(jí)要大,但這是一個(gè)2B的業(yè)務(wù),之前是不好做的,因?yàn)槌杀咎摺?/p>
大家也看到很多樓宇物業(yè)已經(jīng)應(yīng)用了包括人臉門(mén)禁,它不是一個(gè)新鮮的事物,刷臉然后進(jìn)門(mén)或者拍一個(gè)證件對(duì)臉進(jìn)行驗(yàn)證之后就可以進(jìn)去了,證明你的人和證件是同一個(gè)。但是智能辦公的要求是不一樣的,它的要求是不只在門(mén)口要有這樣的設(shè)備,在公司的各個(gè)角落里都要有,包括休閑區(qū)、工作區(qū),甚至車(chē)口、門(mén)口等等,這作用是什么呢?作用就是把辦公區(qū)里人的行為數(shù)據(jù)化,當(dāng)然能做到這點(diǎn)的前提就是成本降低了。包括收費(fèi)業(yè)務(wù),有些朋友應(yīng)該發(fā)現(xiàn)廣東這邊已經(jīng)有了,就是當(dāng)你進(jìn)入高速路口時(shí),可以刷支付寶進(jìn)行收費(fèi),不用去ETC,也不用去交現(xiàn)金。很快它可能做到連手機(jī)的支付寶也不用刷了,它看到你的車(chē)牌,并且看到你的臉,把車(chē)牌和你的臉進(jìn)行驗(yàn)證之后,你就直接可以開(kāi)車(chē)通過(guò)了。當(dāng)然之前你要通過(guò)支付寶去存一些錢(qián),或者綁定支付寶在相應(yīng)的帳戶(hù)里,這樣就會(huì)得到一個(gè)更快捷的通過(guò)方法。后面還有幾個(gè)這樣的業(yè)務(wù)目標(biāo),不擴(kuò)展講了。我覺(jué)得蠻有意思的,通過(guò)一種技術(shù)從高大上而專(zhuān)業(yè)(圖左邊)到走向非常便宜而廣泛(圖右邊)的這一路上,有非常多的機(jī)會(huì)。實(shí)際上正是這樣的轉(zhuǎn)變,才能讓一個(gè)技術(shù)真正落地,實(shí)現(xiàn)它的價(jià)值。
你的業(yè)務(wù)需要一個(gè)算法團(tuán)隊(duì)嗎?
這個(gè)問(wèn)題好多人問(wèn)的,就是當(dāng)你的公司想做一些AI相關(guān)的業(yè)務(wù),你需不需要自己養(yǎng)一個(gè)算法團(tuán)隊(duì)。這沒(méi)有直接的答案,得具體問(wèn)題具體分析,需要看是哪些方面的業(yè)務(wù)。
首先你的業(yè)務(wù)從AI的層面上來(lái)講,是不是一個(gè)通用的類(lèi)型。比如說(shuō)你希望像美圖秀秀拍一個(gè)人臉之后進(jìn)行美化,這個(gè)就有有可能不需要自己的AI團(tuán)隊(duì),百度騰訊谷歌微軟這樣一些提供基礎(chǔ)AI服務(wù)的公共資源以及像“一桶筐湯”這樣的公司提供的方案,都可以是你的選擇。但是當(dāng)你遇到一些業(yè)務(wù)別人并沒(méi)有涉及過(guò)的或者你的領(lǐng)域數(shù)據(jù)很獨(dú)特時(shí),可能就得養(yǎng)一個(gè)算法團(tuán)隊(duì)了。但是需要更正一下,確切的說(shuō)是算法“工程”團(tuán)隊(duì)。算法團(tuán)隊(duì)是更基礎(chǔ)的層面,但算法工程團(tuán)隊(duì)實(shí)際上是把現(xiàn)成的算法進(jìn)行實(shí)踐和工程化的團(tuán)隊(duì),這是非常必要的。
做一個(gè)AI的業(yè)務(wù)在研發(fā)團(tuán)隊(duì)里需要有這樣一些角色,算法團(tuán)隊(duì)、軟件團(tuán)隊(duì)、設(shè)備團(tuán)隊(duì),更包括運(yùn)營(yíng)和售前。這些團(tuán)隊(duì)角色之間的關(guān)系,我簡(jiǎn)單講一下。比如說(shuō)算法團(tuán)隊(duì)和軟件團(tuán)隊(duì)之間的關(guān)系,看起來(lái)很自然,算法團(tuán)隊(duì)提供算法,給軟件團(tuán)隊(duì)來(lái)包裝成產(chǎn)品。但實(shí)際上并不是這么直接,算法的結(jié)果一定是循序漸進(jìn)的,開(kāi)始得到的結(jié)果肯定不好。軟件團(tuán)隊(duì)提供給用戶(hù)的價(jià)值,是通過(guò)算法體現(xiàn)出來(lái),但是算法還不夠好的過(guò)程中,軟件要當(dāng)好一個(gè)背鍋俠的角色,它需要通過(guò)各種手段來(lái)進(jìn)行補(bǔ)助。算法不是萬(wàn)能的,軟件在合適的時(shí)候巧妙的使用算法,才能實(shí)現(xiàn)算法最大的價(jià)值,不能美玉當(dāng)磚。這些團(tuán)隊(duì)里,有不少故事可以講,有機(jī)會(huì)我專(zhuān)門(mén)整理。
今天的分享就到這里,謝謝大家。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 后人工智能時(shí)代:2025年,在紛擾中重塑數(shù)據(jù)、洞察和行動(dòng)
- 2025年展望:人工智能推動(dòng)IT整合
- 量子計(jì)算:商業(yè)世界的新前沿與設(shè)計(jì)思維的融合
- IDC:三季度全球以太網(wǎng)交換機(jī)收入同比下降7.9%、環(huán)比增長(zhǎng)6.6%
- Fortinet李宏凱:2025年在中國(guó)大陸啟動(dòng)SASE PoP節(jié)點(diǎn)部署 助力企業(yè)出海
- Fortinet李宏凱:2024年Fortinet全球客戶(hù)已超80萬(wàn)
- 央國(guó)企采購(gòu)管理升級(jí),合合信息旗下啟信慧眼以科技破局難點(diǎn)
- Apache Struts重大漏洞被黑客利用,遠(yuǎn)程代碼執(zhí)行風(fēng)險(xiǎn)加劇
- Crunchbase:2024年AI網(wǎng)絡(luò)安全行業(yè)風(fēng)險(xiǎn)投資超過(guò)26億美元
- 調(diào)查報(bào)告:AI與云重塑IT格局,77%的IT領(lǐng)導(dǎo)者視網(wǎng)絡(luò)安全為首要挑戰(zhàn)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。