沒有好的數(shù)據(jù),AI就沒有未來,已經(jīng)成為行業(yè)共識。人工智能行業(yè)與數(shù)據(jù)標注行業(yè)實際上是一個水漲船高的關系,人工智能行業(yè)越發(fā)達,數(shù)據(jù)標注行業(yè)的商業(yè)機會越大,這個道理是如此明顯,未來AI數(shù)據(jù)行業(yè)不可估量。
12月8日,由國家發(fā)改委國際合作中心、中關村管委會和大興區(qū)政府指導的2019T-EDGE全球創(chuàng)新大會在北京召開。在當天最重磅的“2019EDGE Awards全球創(chuàng)新評選”上,共有九家企業(yè)獲得“2019年度科技企業(yè)”獎,其中大部分是像華為、順豐、戴森等這樣在C端具有知名度的行業(yè)巨頭公司,然而其中卻有一家深耕企業(yè)服務的公司—Testin云測,值得我們好好聊一聊。
在科技行業(yè)內(nèi),Testin云測早已是大家的“老熟人”。2011年創(chuàng)立之時,Testin云測正趕上手機行業(yè)從功能機向智能手機轉型的關鍵時期,App開發(fā)是行業(yè)最大風口,Testin云測應時而生,開創(chuàng)了測試行業(yè)向云測試行業(yè)的轉變,由此積累起大量客戶、建立了行業(yè)品牌地位,成為垂直領域的獨角獸。
然而這次Testin云測獲獎,卻應該不是因為它的測試業(yè)務,而是近兩年異軍突起的AI數(shù)據(jù)標注業(yè)務。
事實上,EDGE Awards此項年度科技企業(yè)獎頒獎標準是“2019年不斷創(chuàng)新并突破自己,在科技領域擁有核心競爭能力,為社會做出杰出貢獻的企業(yè)”,像華為獲獎,是因為它對外發(fā)布了自研操作系統(tǒng)鴻蒙OS,獵豹移動是因為其在智能服務機器人方向布局。而Testin云測也是如此,當年App興起時,Tesitn云測以云測試搶占風口,獲得了成功,現(xiàn)在人工智能時代大潮襲來,Testin云測又以人工智能三要素之一的數(shù)據(jù)為抓手,成立AI數(shù)據(jù)標注業(yè)務品牌——云測數(shù)據(jù),再次成為行業(yè)Top1。
眾所周知,人工智能三要素是數(shù)據(jù)、算力和算法,其中數(shù)據(jù)居于首位,歷經(jīng)多個發(fā)展階段后,數(shù)據(jù)正在人工智能進化中發(fā)揮著越來越重要的作用,目前人工智能算法的訓練主要依靠大量數(shù)據(jù)來完成,而未來定制化、場景化的數(shù)據(jù)也將成為為人工智能商業(yè)化落地的關鍵,然而隨著AI企業(yè)對獲得特定場景數(shù)據(jù)的需求越來越大,單靠自身收集既不效率也不積極,這就使得專業(yè)的AI數(shù)據(jù)服務提供商云測數(shù)據(jù)應運而生。
從這個角度而言,如果說數(shù)據(jù)對于算法就像汽油之于發(fā)動機,那么Testin云測這樣的企業(yè)就扮演了一個AI領域“兩桶油”的角色,為中國人工智能產(chǎn)業(yè)提供高質(zhì)數(shù)據(jù)燃料。
就像中石化和中石油一樣,它們不但負責原油的開采,更負責油品的冶煉,云測數(shù)據(jù)通過自建數(shù)據(jù)場景實驗室和數(shù)據(jù)標注基地為智能駕駛、智能家居、智慧城市、智慧金融、新零售等領域提供定制化的數(shù)據(jù)標注、數(shù)據(jù)采集服務,全方位支持文本、語音、圖像、視頻等各類型數(shù)據(jù)的處理,成功幫助AI企業(yè)或AI部門構建數(shù)據(jù)核心壁壘,為中國的AI產(chǎn)業(yè)持續(xù)提供動力,這才應該是Testin云測獲得“2019年度科技企業(yè)”的最重要原因。
沒有好的數(shù)據(jù),AI就沒有未來
在云測數(shù)據(jù)做大之前,數(shù)據(jù)標注一直被行業(yè)里視為一個隱藏在人工智能領域里的勞動密集型產(chǎn)業(yè)。
何謂數(shù)據(jù)標注?簡單說就是對各種類型的數(shù)據(jù)包括文本、圖片、語音、視頻等完成分類、標框、注釋、標記并打上說明其某種屬性的標簽。人工智能需要海量數(shù)據(jù),但海量數(shù)據(jù)并不等同于可以供機器學習的訓練數(shù)據(jù),符合質(zhì)量的訓練數(shù)據(jù)需要經(jīng)過數(shù)據(jù)標注。
數(shù)據(jù)標注成為一種產(chǎn)業(yè)始于2005年,當時以亞馬遜的Mturk為代表的一種新的數(shù)據(jù)采集服務——眾包模式開始出現(xiàn),其被大量的硅谷公司采用于訓練AI算法,這種眾包模式后來也流傳到國內(nèi)。
數(shù)據(jù)標注的眾包模式從一開始就是一個勞動密集型產(chǎn)業(yè),因為它基本上是靠人工來實現(xiàn),也就是由數(shù)據(jù)標注員完成,其技術門檻實際上很低,這使得中國河北、河南、山東、山西等地區(qū)出現(xiàn)了很多數(shù)據(jù)標注小作坊,數(shù)據(jù)標注產(chǎn)業(yè)甚至為這些地區(qū)的小城鎮(zhèn)和農(nóng)村提供了大量就業(yè)機會。
大量勞動密集型的數(shù)據(jù)標注工廠在AI產(chǎn)業(yè)爆發(fā)初期,為中國人工智能企業(yè)的崛起做出了巨大的貢獻。然而,就像兒童成長不同階段需要不同的營養(yǎng)攝入一樣,隨著人工智能產(chǎn)業(yè)的發(fā)展與進化,AI企業(yè)在落地過程中發(fā)現(xiàn),所需要的數(shù)據(jù)維度和復雜度正變得越來越高,數(shù)據(jù)服務的眾包模式以及通用數(shù)據(jù)集已經(jīng)難以滿足AI企業(yè)的數(shù)據(jù)需求。這個時候,定制化的數(shù)據(jù)服務模式就出現(xiàn)了。
就像云測數(shù)據(jù)總經(jīng)理所說:如果以前的數(shù)據(jù)標注是為AI企業(yè)提供飼料,那么現(xiàn)在云測數(shù)據(jù)的業(yè)務目標是要充當嬰兒的奶粉,運動員的優(yōu)質(zhì)蛋白,以幫助AI企業(yè)加速產(chǎn)業(yè)化進程。
于是,云測數(shù)據(jù)開始在華東、華北、華南等地建設數(shù)據(jù)交付中心和數(shù)據(jù)采集基地,致力于為 AI 企業(yè)提供全流程一體化的高精、高質(zhì)數(shù)據(jù)服務解決方案,至今,已經(jīng)為國內(nèi)外數(shù)百家企業(yè)提供了AI數(shù)據(jù)服務。
需要值得一提的是,云測數(shù)據(jù)進軍數(shù)據(jù)標注領域并非一拍腦袋的決策,而是有幾大原因在背后推動。
首先,數(shù)據(jù)標注服務也是從屬于數(shù)據(jù)服務這一大市場之下,而云測數(shù)據(jù)具有這方面的資源稟賦優(yōu)勢,或者說叫基因。過去九年間,作為市場上重要的獨立第三方的企業(yè)服務平臺, Testin云測已經(jīng)在行業(yè)積累了廣泛的品牌影響力、技術實力及流程化管理能力,旗下AI數(shù)據(jù)服務品牌云測數(shù)據(jù)并不是裸身登場,而是挾勢而來。
其次是這個市場足夠大。數(shù)據(jù)標注服務既屬于數(shù)據(jù)服務市場,又屬于人工智能市場。根據(jù)預估,明年中國人工智能核心產(chǎn)業(yè)規(guī)模將超過1500億元,帶動相關產(chǎn)業(yè)規(guī)模超過1萬億元,如果放諸全世界則更大。
按照相關人士的估算,一個500萬的AI項目會有10%的資金用于數(shù)據(jù)的采集和標記。由此可以推算出,到了2020年,數(shù)據(jù)標注行業(yè)的市場規(guī)模將能夠達到150億。
最后,就是現(xiàn)有數(shù)據(jù)標注行業(yè)的良莠不齊,為云測數(shù)據(jù)這樣的參與者提供了通過差異化競爭勝出的機會。
前文已經(jīng)講到,隨著AI技術的發(fā)展,AI技術公司對數(shù)據(jù)的要求也越來越高。這種高要求體現(xiàn)在兩個方面,一是對數(shù)據(jù)質(zhì)量本身要求越來越高,這包括數(shù)據(jù)的精準性、獨立性和安全性。因為算法的精度與數(shù)據(jù)的質(zhì)量有著直接關系,數(shù)據(jù)的數(shù)量和質(zhì)量會成為產(chǎn)品落地的瓶頸。
二是對數(shù)據(jù)的定制化和場景化要求也越來越高。中國現(xiàn)在有上千家AI公司,它們都是生存在不同的商業(yè)場景之下,且人工智能正在積極擁抱各行各業(yè),相對應的算法模型就需要更多還原真實場景的數(shù)據(jù)需求,小數(shù)據(jù)的搜集和標注已經(jīng)成為人工智能產(chǎn)業(yè)化落地的桎梏。
當現(xiàn)有數(shù)據(jù)標注服務的眾包模式以及通用數(shù)據(jù)集難以滿足所有數(shù)據(jù)的需求時,云測數(shù)據(jù)在數(shù)據(jù)標注領域的差異化競爭機會就來了。
簡而言之, “沒有好的數(shù)據(jù),AI就沒有未來”,云測數(shù)據(jù)在數(shù)據(jù)標注領域的商業(yè)機會,歸根到底還是因為AI企業(yè)對“好的數(shù)據(jù)”需求越來越強烈,它們需要有一家提供“好數(shù)據(jù)”的龍頭企業(yè)出現(xiàn)。
高質(zhì)、精準、安全:為數(shù)據(jù)正身
在對市場機會考慮清楚之后,Testin云測正式推出了其AI數(shù)據(jù)服務品牌——云測數(shù)據(jù)。
幾年時間,云測數(shù)據(jù)已經(jīng)成長為市場頭部品牌,直到這次2019年底為Testin云測在EDGE Awards全球創(chuàng)新評選上拿下“2019年度科技企業(yè)”。
云測數(shù)據(jù)是怎么做到的?所謂大道至簡,其實說來并不復雜,核心就是針對人工智能產(chǎn)業(yè)落地呼喚“更好數(shù)據(jù)”的最新需求變化有的放矢,重建和升級了原有的數(shù)據(jù)標注產(chǎn)業(yè)模式。
首先,通過在人員、軟硬件設施等方面的大投入提高了行業(yè)的進入門檻。為了產(chǎn)出更高質(zhì)量的數(shù)據(jù),云測數(shù)據(jù)在華東、華北、華南等地都建設了數(shù)據(jù)交付中心和數(shù)據(jù)采集基地,并實現(xiàn)了一整套標準化作業(yè)流轉。在數(shù)據(jù)采集基地,其標注和質(zhì)檢人員、項目經(jīng)理每天面對面溝通,確保每個人能夠理解,并掌握標注有關技術,技能和經(jīng)驗能夠得到持續(xù)的提升。
目前,云測數(shù)據(jù)已經(jīng)擁有近千人的數(shù)據(jù)標注團隊,在規(guī)模以及質(zhì)量上都處在行業(yè)前列。正式上崗前,他們都要經(jīng)過行業(yè)知識、平臺工具使用、基地規(guī)范制度等內(nèi)容的團隊培訓流程。
其次,重建了數(shù)據(jù)標注行業(yè)的安全生產(chǎn)流程,也就是要保證絕對的數(shù)據(jù)安全。這里數(shù)據(jù)安全的意思不單是指數(shù)據(jù)不被污染,更是指不被泄露,不侵犯用戶隱私。因為對AI企業(yè)來說,數(shù)據(jù)就是其核心壁壘的一部分,AI企業(yè)將數(shù)據(jù)標注服務交給誰,就意味著誰的高度信任。這就使得數(shù)據(jù)安全成為一種內(nèi)在競爭優(yōu)勢。
誰更安全誰就更容易爭得客戶。云測數(shù)據(jù)基于此除了所有數(shù)據(jù)采集的用戶都簽訂數(shù)據(jù)授權協(xié)議,保證AI企業(yè)用于訓練的數(shù)據(jù)合法合規(guī)之外,云測數(shù)據(jù)內(nèi)部還設定了數(shù)據(jù)隔離、質(zhì)量保障等一系列保護數(shù)據(jù)安全的流程,以在確保企業(yè)數(shù)據(jù)安全的情況下,持續(xù)為數(shù)據(jù)采集和數(shù)據(jù)標注構建和優(yōu)化自己的方案。
第三,主打場景定制化AI數(shù)據(jù)服務,實現(xiàn)廣泛業(yè)務領域覆蓋。針對AI企業(yè)對場景化數(shù)據(jù)的巨大需求,從創(chuàng)立開始,云測數(shù)據(jù)就把為客戶提供定制化場景數(shù)據(jù)采集和標注服務作為業(yè)務重點,到今天為止,云測數(shù)據(jù)已經(jīng)覆蓋了智能駕駛、智慧城市、智能家居、智慧金融、零售等幾乎所有AI市場的重要領域。通過場景實驗室的建立,實現(xiàn)場景定制化AI數(shù)據(jù)服務以幫助企業(yè)完善產(chǎn)品發(fā)布之前需要的訓練數(shù)據(jù)。
就像Testin云測CMO張鵬飛強調(diào)的那樣“從整體看來,AI數(shù)據(jù)行業(yè)關于安全、隱私等方面并沒有統(tǒng)一的標準和強調(diào)重視。但從我們長遠角度出發(fā),一直在隱私和安全防護角度下大力氣服務行業(yè)、樹立數(shù)據(jù)質(zhì)量標桿,只有以這種負責的態(tài)度來服務客戶,我們的行業(yè)才能‘良幣驅(qū)除劣幣’,真正讓人工智能成為新一輪技術革命,改變整個社會和人類進程”。
不可阻擋的大勢所趨
事實上,所有的這一切,只為了一個目的:向AI企業(yè)提供更高質(zhì)、更精準、更安全的數(shù)據(jù)。
對于習慣成長于數(shù)據(jù)采集粗放式經(jīng)營時期的企業(yè)來說,云測數(shù)據(jù)就像一個特立獨行者,因為它的出現(xiàn)推高了行業(yè)整體質(zhì)量水平線,壓縮了水平線之下企業(yè)的生存空間。
但這卻是不可阻擋的大勢所趨,這樣的行業(yè)顛覆,不是云測數(shù)據(jù)來做,也必定會有其他企業(yè)來做,因為客戶需求就擺在那里。
回顧數(shù)據(jù)服務行業(yè)的發(fā)展歷程,會發(fā)現(xiàn)實際上經(jīng)過了三個階段,最初是實驗室階段或步行階段,這一階段AI企業(yè)對數(shù)據(jù)的要求還比較初級,甚至很多數(shù)據(jù)幾乎連標注都不用就可以被拿來用;第二個階段是所謂勞動密集型階段或馬車階段,眾包成為主要模式;今天則已經(jīng)進入第三個階段,也就是數(shù)據(jù)服務的場景化和精細化時代,人工智能從馬車速度前行,到起飛前夜,從吃飼料到要喝航空汽油,這就使得云測數(shù)據(jù)這樣的高端數(shù)據(jù)供應商成為市場剛需。
沒有好的數(shù)據(jù),AI就沒有未來,已經(jīng)成為行業(yè)共識。人工智能行業(yè)與數(shù)據(jù)標注行業(yè)實際上是一個水漲船高的關系,人工智能行業(yè)越發(fā)達,數(shù)據(jù)標注行業(yè)的商業(yè)機會越大,這個道理是如此明顯,未來AI數(shù)據(jù)行業(yè)不可估量。
但這對云測數(shù)據(jù)來說也并不是壞事,因為這個市場太大了,云測數(shù)據(jù)可以成為頭部玩家,更重要的是,因為數(shù)據(jù)這一關鍵詞,使得數(shù)據(jù)標注行業(yè)不只面對市場和商業(yè)化,同時意味著社會價值,還承擔著社會責任,只有更多企業(yè)一起用力,才能更快的凈化行業(yè)亂象,建立起行業(yè)規(guī)范,整個行業(yè)才能做大做強。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 為什么年輕人不愛換手機了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應欠薪有補償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學
- 窺見“新紀元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進,核心技術決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領域達成戰(zhàn)略合作伙伴關系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。