上個(gè)世紀(jì)五十年代,麥卡錫當(dāng)時(shí)為達(dá)特茅斯會(huì)議命名了一個(gè)在那時(shí)看起來(lái)別出心裁的名字:人工智能夏季研討會(huì)(Summer Research Project on Artificial Intelligence),由此“人工智能(ArtificialIntelligence)”這個(gè)概念開(kāi)始走向世界。
歷經(jīng)了半個(gè)多世紀(jì)的AI一直都不溫不火,但近幾年AI突然爆發(fā),在人工智能大量邊緣設(shè)備落地的同時(shí),將其推上一個(gè)更為興盛的階段:圍棋人工智能程序AlphaGo橫掃棋壇,傳統(tǒng)與文化相結(jié)合獨(dú)具一格的“AI茶館”,甚至還有騰訊去年在“AI+醫(yī)療”領(lǐng)域打造的“救命AI”——騰訊AI醫(yī)療產(chǎn)品的聚合。
AI迅速爆發(fā)的背后究竟靠的是什么?現(xiàn)下眾多巨頭企業(yè)、初創(chuàng)公司等紛紛入局人工智能領(lǐng)域,都在嘗試尋找全新突破口。業(yè)內(nèi)曾流傳著這樣一句話:得“數(shù)據(jù)”者,得“人工智能”,而能將“人工智能”玩的轉(zhuǎn)的,便能稱的上是撬動(dòng)世界第四次工業(yè)革命的先鋒了。
偏偏是“數(shù)據(jù)”扼住了AI命運(yùn)的咽喉?
從發(fā)展意義來(lái)看,人工智能(AI)在不斷的進(jìn)步,并且隨著這種進(jìn)步勢(shì)必會(huì)改變一大批產(chǎn)業(yè)的形態(tài)。此外,從另一方面看,人工智能技術(shù)的背后有三大支柱:算法、算力和數(shù)據(jù),這三者相輔相成、相互制約,但其中數(shù)據(jù)是核心要義,只要有了大量?jī)?yōu)質(zhì)精準(zhǔn)的數(shù)據(jù),再加上算法實(shí)現(xiàn)高效的機(jī)器運(yùn)算、算力的推動(dòng),AI才能越走越遠(yuǎn)。
“沒(méi)有好的數(shù)據(jù),人工智能將沒(méi)有未來(lái)”已經(jīng)成為業(yè)界共識(shí)。
值得一提的是,這里有兩個(gè)重要的點(diǎn)需要區(qū)分:一個(gè)是數(shù)據(jù),另一個(gè)是好的數(shù)據(jù):“高質(zhì)、精準(zhǔn)、安全”。
云測(cè)數(shù)據(jù)賈宇航表示:“首先數(shù)據(jù)是人工智能底層邏輯中不可或缺的支撐要素,因?yàn)槿斯ぶ悄艿谋举|(zhì)就像人類(lèi)要不斷的通過(guò)訓(xùn)練來(lái)獲取技能一樣,AI的根基就是訓(xùn)練,需要經(jīng)過(guò)大量數(shù)據(jù)進(jìn)行訓(xùn)練,神經(jīng)網(wǎng)絡(luò)才能總結(jié)出規(guī)律,進(jìn)而熟能生巧的應(yīng)用到新樣本上”。
也就是說(shuō),數(shù)據(jù)是最基本的燃料,沒(méi)有燃料,AI這艘火箭是不可能直沖云霄,而商業(yè)落地更是遙不可及的夢(mèng)。從自動(dòng)駕駛到AI聊天、服務(wù)機(jī)器人,從人臉識(shí)別到各類(lèi)AI邊緣落地化產(chǎn)品,數(shù)據(jù)是真正的“幕后英雄”,無(wú)“數(shù)據(jù)”不“AI”。
其次,要想經(jīng)算法訓(xùn)練后獲得的模型更加智能,僅“數(shù)據(jù)”遠(yuǎn)遠(yuǎn)不夠的,這背后更多的是對(duì)數(shù)據(jù)的“高質(zhì)、精準(zhǔn)、安全”的要求。
例如在訓(xùn)練的過(guò)程中,高質(zhì)精準(zhǔn)的數(shù)據(jù)扮演著“教科書(shū)”級(jí)別的重要角色。如果僅需要識(shí)別勺子,但在訓(xùn)練數(shù)據(jù)中勺子總和碗、筷子一起出現(xiàn),那么AI系統(tǒng)可能會(huì)誤入歧途,進(jìn)入一種“瞎猜”的狀態(tài)而產(chǎn)生混亂和誤差,結(jié)果很可能會(huì)將碗或筷子識(shí)別成勺子。所以對(duì)于人工智能來(lái)說(shuō),雖然大量的訓(xùn)練數(shù)據(jù)固然很重要,但更重要的是數(shù)據(jù)的“高質(zhì)精準(zhǔn)”。
再?gòu)牧硪环矫婵础案哔|(zhì)精準(zhǔn)的數(shù)據(jù)”對(duì)算法模型來(lái)講究竟有多重要?
現(xiàn)在人工智能處在產(chǎn)業(yè)落地前夕,可以說(shuō)AI產(chǎn)品的精準(zhǔn)數(shù)據(jù)訓(xùn)練直接影響落地產(chǎn)品的良品率;舉個(gè)不恰當(dāng)?shù)睦?,如?a href="http://worldfootballweekly.com/%E8%87%AA%E5%8A%A8%E9%A9%BE%E9%A9%B6_1.html" target="_blank" class="keylink">自動(dòng)駕駛系統(tǒng)的訓(xùn)練數(shù)據(jù)的缺乏或不精準(zhǔn),則很可能在行駛過(guò)程中由于未正確識(shí)別物體數(shù)據(jù)直接導(dǎo)致人身傷亡,這些后果都是不堪設(shè)想的。
此外,數(shù)據(jù)標(biāo)注的價(jià)值不僅體現(xiàn)在物體識(shí)別上。當(dāng)下人工智能整個(gè)行業(yè)都在往多模態(tài)的方向發(fā)展,比如以智能駕駛為例,基于傳統(tǒng)的車(chē)外環(huán)境感知系統(tǒng)一般都采用攝像頭做設(shè)計(jì),以至于存在著測(cè)距效果差等缺陷,現(xiàn)在引入激光雷達(dá)后,在數(shù)據(jù)的提升上對(duì)應(yīng)是既有圖像又有3D點(diǎn)云的三維數(shù)據(jù)的耦合。
隨著人工智能逐漸從學(xué)術(shù)走向產(chǎn)品化、落地化、市場(chǎng)化,企業(yè)對(duì)于場(chǎng)景數(shù)據(jù)的要求也越來(lái)越多維,所以引入更多維度的數(shù)據(jù)去完善AI產(chǎn)品落地前的模型,也是當(dāng)下行業(yè)發(fā)展的趨勢(shì)。
直擊行業(yè)痛點(diǎn),這樣的“數(shù)據(jù)一把手”才更性感
傳統(tǒng)的數(shù)據(jù)清洗標(biāo)注工作呈現(xiàn)出一種“數(shù)據(jù)粗放型處理”的狀況,從移動(dòng)互聯(lián)中大量獲取公開(kāi)、通用的數(shù)據(jù),通過(guò)雇傭廉價(jià)的勞動(dòng)力完成數(shù)據(jù)的清晰標(biāo)注工作,“道路、天空、大樹(shù)”大致標(biāo)注粗糙勾選后,便全部投入應(yīng)用到神經(jīng)網(wǎng)絡(luò)中。
但隨著人工智能發(fā)展至商業(yè)落地前夕,算法模型對(duì)高質(zhì)量、高精度數(shù)據(jù)的需求極速提升,以往的通用數(shù)據(jù)集越來(lái)越不能滿足AI企業(yè)的數(shù)據(jù)需要,人工智能落地越來(lái)越專(zhuān)注于小場(chǎng)景和專(zhuān)業(yè)領(lǐng)域。人工智能不再是漂浮在“空中的樓閣”,基于AI實(shí)際應(yīng)用場(chǎng)景的數(shù)據(jù)服務(wù),已成為人工智能落地的核心地基。
賈宇航表示:“在這個(gè)行業(yè)中有一個(gè)‘garbage in garbage out’的理論,即如果標(biāo)注完的數(shù)據(jù)精度達(dá)不到標(biāo)準(zhǔn),那么訓(xùn)練出來(lái)的算法也是不精準(zhǔn)的?!比缃褚晃洞址诺奶幚砟J郊炔荒軡M足逐漸商用的AI企業(yè)的數(shù)據(jù)需求,甚至還將影響技術(shù)本身的發(fā)展。
面對(duì)這樣的產(chǎn)業(yè)趨勢(shì),云測(cè)數(shù)據(jù)作為行業(yè)的典型代表,直擊行業(yè)痛點(diǎn):將“精準(zhǔn)高質(zhì)”“獨(dú)立安全”作為業(yè)務(wù)發(fā)展的核心,并隨著AI企業(yè)數(shù)據(jù)需求不斷的演進(jìn)。
有剛性需求便會(huì)有實(shí)時(shí)供給,有痛點(diǎn)問(wèn)題便就有解決方案。云測(cè)數(shù)據(jù)基于其自建的數(shù)據(jù)標(biāo)注基地和場(chǎng)景實(shí)驗(yàn)室,根據(jù)AI企業(yè)數(shù)據(jù)需求,進(jìn)行特定動(dòng)作、表情和表情的捕捉,將精準(zhǔn)的數(shù)據(jù)投入到流程化規(guī)范生產(chǎn)的數(shù)據(jù)標(biāo)注環(huán)節(jié)中,最終輸出精準(zhǔn)高質(zhì)的數(shù)據(jù)。解決特定場(chǎng)景化下的數(shù)據(jù)缺失、質(zhì)量良莠不齊、安全性等行業(yè)問(wèn)題,以幫助AI企業(yè)打造以高精度數(shù)據(jù)為核心的行業(yè)壁壘。
場(chǎng)景實(shí)驗(yàn)室是云測(cè)數(shù)據(jù)布局高度定制化、多模態(tài)的AI數(shù)據(jù)服務(wù)的重要組成部分,以AI企業(yè)的具體算法模型的特定需求來(lái)定制化搭建采集場(chǎng)景,致力于覆蓋盡可能多的實(shí)際場(chǎng)景及邊際場(chǎng)景,從數(shù)據(jù)產(chǎn)生的源頭把控?cái)?shù)據(jù)質(zhì)量。
自建標(biāo)注基地是云測(cè)數(shù)據(jù)保證數(shù)據(jù)精準(zhǔn)高質(zhì)的又一強(qiáng)力保證?;貎?nèi)的全職標(biāo)注人員有利于協(xié)同化管理和快速響應(yīng)企業(yè)數(shù)據(jù)需求。同時(shí)云測(cè)數(shù)據(jù)還基于不同場(chǎng)景對(duì)標(biāo)注人員進(jìn)行領(lǐng)域內(nèi)的細(xì)分,接受固定領(lǐng)域的知識(shí)培訓(xùn)。得到高效的行業(yè)知識(shí)輸入,在理解企業(yè)客戶的需求上就能做到準(zhǔn)確無(wú)誤的輸出。
所以,AI的背后是數(shù)據(jù),行業(yè)的幕后是云測(cè)數(shù)據(jù)——這樣的“行業(yè)數(shù)據(jù)一把手”才著實(shí)性感。
數(shù)據(jù)安全成核心,行業(yè)規(guī)范亟需建立
目前云測(cè)數(shù)據(jù)基于自建的數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室和數(shù)據(jù)標(biāo)注基地,服務(wù)領(lǐng)域已涉及智能駕駛、智能家居、智慧城市、智慧金融、新零售等領(lǐng)域,實(shí)時(shí)為領(lǐng)域內(nèi)各個(gè)AI企業(yè)提供定制化的數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注服務(wù),全方位支持文本、語(yǔ)音、圖像、視頻等各類(lèi)型數(shù)據(jù)的處理。
更重要的一條前置底線是,云測(cè)數(shù)據(jù)除了提供優(yōu)質(zhì)數(shù)據(jù),更是把數(shù)據(jù)隱私安全做到了極致。從防火墻的設(shè)置、到內(nèi)部信息系統(tǒng)的管護(hù),乃至標(biāo)準(zhǔn)化的流程作業(yè)體系等,將一整套的安全防護(hù)和信息保護(hù)的機(jī)制,應(yīng)用在數(shù)據(jù)標(biāo)注生產(chǎn)的各環(huán)節(jié)。
賈宇航告訴獵云網(wǎng):“對(duì)于一個(gè)企業(yè)來(lái)講,擁有了數(shù)據(jù)便就擁有了核心競(jìng)爭(zhēng)力,數(shù)據(jù)安全一直都是我們極其重視的一點(diǎn)。首先我們要做到的,是數(shù)據(jù)絕不復(fù)用,第二就是保證數(shù)據(jù)隱私性。與所有數(shù)據(jù)采集的用戶都簽訂數(shù)據(jù)授權(quán)協(xié)議,確保AI企業(yè)用于訓(xùn)練的數(shù)據(jù)合法合規(guī)。”
Testin云測(cè)CMO張鵬飛也強(qiáng)調(diào)“從整體看來(lái),AI數(shù)據(jù)行業(yè)關(guān)于安全、隱私等方面并沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)和強(qiáng)調(diào)重視。但從我們長(zhǎng)遠(yuǎn)角度出發(fā),一直在隱私和安全防護(hù)角度下大力氣服務(wù)行業(yè)、樹(shù)立數(shù)據(jù)質(zhì)量標(biāo)桿,只有以這種負(fù)責(zé)的態(tài)度來(lái)服務(wù)客戶,我們的行業(yè)才能‘良幣驅(qū)除劣幣’,真正讓人工智能成為新一輪技術(shù)革命,改變整個(gè)社會(huì)和人類(lèi)進(jìn)程”。
人工智能的發(fā)展離不開(kāi)數(shù)據(jù)的支撐,更離不開(kāi)AI數(shù)據(jù)做“燃料”。如果非要用一句話來(lái)定義這個(gè)時(shí)代的“人工智能”和“數(shù)據(jù)”的關(guān)系,可以說(shuō)是:數(shù)據(jù)是人工智能的核心要義,而“高質(zhì)精準(zhǔn)、獨(dú)立安全”的數(shù)據(jù),則是撬動(dòng)世界第四次工業(yè)革命(人工智能浪潮)的關(guān)鍵所在。
作者:郭亞鑫
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )