原標(biāo)題:下一個(gè)十年:數(shù)據(jù)信仰與認(rèn)知智能
下一個(gè)十年,哪些技術(shù)將帶來革命性的改變?
在一個(gè)新技術(shù)層出不窮的時(shí)代,對于這個(gè)問題,恐怕大部分企業(yè)與組織都在積極思考。
百分點(diǎn)技術(shù)副總裁兼首席架構(gòu)師劉譯璟博士認(rèn)為,在產(chǎn)業(yè)數(shù)字化逐步深入的趨勢下,以自然語言處理(NLP)、知識(shí)圖譜為代表的認(rèn)知智能技術(shù)將會(huì)以場景為切入點(diǎn),通過以點(diǎn)帶面、從局部到整體、層層推進(jìn)的方式實(shí)現(xiàn)突破,從而為數(shù)字世界的交互與決策帶來顛覆性改變。
百分點(diǎn)技術(shù)副總裁兼首席架構(gòu)師劉譯璟博士
為什么認(rèn)知智能技術(shù)得到業(yè)界如此重視呢?這一切還得從數(shù)據(jù)開始說起……
//
數(shù)據(jù)信仰正在加速形成
//
尤瓦爾赫拉利曾在《未來簡史》中預(yù)言:數(shù)據(jù)將成為人們未來的信仰。
現(xiàn)實(shí)情況中,企業(yè)與組織對于數(shù)據(jù)及其價(jià)值的認(rèn)可度也在迅速提升。業(yè)界普遍認(rèn)為,數(shù)據(jù)正在成為一種新型的生產(chǎn)資料,是未來企業(yè)/組織業(yè)務(wù)運(yùn)轉(zhuǎn)中不可或缺的要素。一位制造業(yè)企業(yè)CIO在向筆者談到數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)時(shí)表示:“隨著研發(fā)、制造、倉儲(chǔ)、物流、服務(wù)等業(yè)務(wù)環(huán)節(jié)的數(shù)據(jù)全方位打通,為大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等技術(shù)的應(yīng)用奠定了重要基礎(chǔ),智能制造已經(jīng)不再是空想,未來將是數(shù)據(jù)進(jìn)驅(qū)動(dòng)業(yè)務(wù)?!?/span>
事實(shí)上,類似這樣的企業(yè)不占少數(shù)。產(chǎn)業(yè)數(shù)字化和企業(yè)數(shù)字化轉(zhuǎn)型的大浪潮下,基于數(shù)據(jù)的能力正在加速顯現(xiàn),并且得到越來越多用戶的認(rèn)可。就如IDG《2018中國企業(yè)數(shù)字化發(fā)展報(bào)告》中提到,企業(yè)在數(shù)字化轉(zhuǎn)型過程中將逐步形成變革能力、敏捷能力、利用生態(tài)的能力、數(shù)字化產(chǎn)品與服務(wù)、數(shù)據(jù)資產(chǎn)化能力、經(jīng)驗(yàn)數(shù)據(jù)化能力,這一切的基礎(chǔ)就是數(shù)據(jù)。
劉譯璟博士直言,用數(shù)據(jù)的角度去看待業(yè)務(wù)和現(xiàn)實(shí),在觀念上是一個(gè)巨大的轉(zhuǎn)變,隨著數(shù)字化程度越來越高,一個(gè)與物理世界相對于的數(shù)字世界在加速形成,并且物理世界與數(shù)字世界之間的交互會(huì)愈發(fā)頻繁。因此,感知智能、認(rèn)知智能等人工智能技術(shù)將會(huì)有巨大的用武之地,用戶對于數(shù)據(jù)的信仰也將會(huì)加速形成。
//
從感知到認(rèn)知:靠深度學(xué)習(xí)不夠
//
眾所周知,得益于算力大幅提升、數(shù)據(jù)愈發(fā)豐富以及以深度學(xué)習(xí)為代表的算法突破,以圖像識(shí)別、語音識(shí)別為代表的感知智能技術(shù)近年來取得了突飛猛進(jìn)的進(jìn)步,并且在金融、零售、教育、安防、智慧城市等多行業(yè)與領(lǐng)域得到了應(yīng)用。
不過,這還遠(yuǎn)遠(yuǎn)不夠。
從技術(shù)發(fā)展的角度來看,從感知智能向認(rèn)知智能是必然趨勢,因?yàn)闊o論是圖像中事物關(guān)系,還是語言中語義,都需要進(jìn)行識(shí)別、理解,這恰恰正是認(rèn)知智能技術(shù)正在努力解決的事情;從現(xiàn)實(shí)的角度來看,認(rèn)知智能技術(shù)可以從海量數(shù)據(jù)中不斷挖掘、提煉和匯聚知識(shí),人們渴望有更深層次的認(rèn)知,從而更好地了解客觀世界。
在劉譯璟看來,感知智能技術(shù)很快會(huì)在實(shí)際業(yè)務(wù)中遇到瓶頸,比如在語音識(shí)別中,如果只做文字層面的轉(zhuǎn)換,而不能從認(rèn)知層面去理解文本/文字的含義,那么對于用戶的價(jià)值其實(shí)并不高;未來一定需要從認(rèn)知層面去理解視覺中動(dòng)作的含義、文字中語義與含義,從而了解業(yè)務(wù)變化并為決策提供支撐?!皬臄?shù)據(jù)到信息,再到知識(shí),認(rèn)知智能技術(shù)將發(fā)揮至關(guān)重要的作用?!?/span>
對于深度學(xué)習(xí),劉譯璟博士認(rèn)為,深度學(xué)習(xí)技術(shù)的確是推動(dòng)了感知智能技術(shù)的快速發(fā)展,但是僅僅依靠深度學(xué)習(xí)技術(shù)是遠(yuǎn)遠(yuǎn)不夠的,深度學(xué)習(xí)是純粹基于數(shù)據(jù)的方法,屬于歸納的范疇,并不具有可解釋性,在一定階段后具有明顯的瓶頸,從感知智能走向認(rèn)知智能,僅僅依靠深度學(xué)習(xí)是遠(yuǎn)遠(yuǎn)不夠的,還需要有更多突破。
//
認(rèn)知智能:到底應(yīng)該如何突破?
//
某種程度而言,認(rèn)知智能技術(shù)的發(fā)展并沒有像感知智能那樣快速,依然有著眾多挑戰(zhàn)等待突破。
雖然近年來很多大公司在努力推動(dòng)包括云計(jì)算、大數(shù)據(jù)、人工智能技術(shù)的發(fā)展,構(gòu)建出系列技術(shù)平臺(tái),希望屏蔽掉底層技術(shù)的復(fù)雜性,推動(dòng)包括認(rèn)知智能技術(shù)在內(nèi)的應(yīng)用發(fā)展,但在實(shí)際業(yè)務(wù)場景中應(yīng)用并未取得令人滿意。
劉譯璟直言,人工智能的變革需要場景應(yīng)用來驅(qū)動(dòng)。正所謂是,獨(dú)立存在不是技術(shù)追求的目標(biāo),依托場景應(yīng)用才是技術(shù)存在的真實(shí)意義。劉譯璟認(rèn)為,以知識(shí)圖譜、自然語言處理為代表認(rèn)知智能技術(shù)的確還有很多需要突破的地方,長期在行業(yè)場景實(shí)踐中實(shí)現(xiàn)突破是最佳的方式。
對于任何一項(xiàng)新技術(shù)都不能在一開始就抱有不切實(shí)際的幻想?!安荒苓^分夸大人工智能技術(shù)現(xiàn)階段的能力,以自動(dòng)駕駛位列,L5級(jí)別的自動(dòng)駕駛現(xiàn)階段的確是非常難實(shí)現(xiàn),因?yàn)樗髾C(jī)器在任何時(shí)候都比人做的好。但是我們可以先從一些特定場景中實(shí)現(xiàn)突破,繼而逐步實(shí)現(xiàn)更多場景的應(yīng)用。像自動(dòng)駕駛在目前城市出租車、園區(qū)接駁車這些場景中就已經(jīng)得到實(shí)現(xiàn)和突破?!眲⒆g璟補(bǔ)充道。
“未來3-5年,認(rèn)知智能一定會(huì)取得更多突破?!眲⒆g璟表示,人工智能進(jìn)入到中期之后,將會(huì)更多的下沉到各個(gè)行業(yè)之中,將會(huì)更多更加具體的業(yè)務(wù)場景,意味著專業(yè)化程度會(huì)更高,可用的數(shù)據(jù)也將更少,專家和方法的重要性會(huì)大幅提高?!跋裰R(shí)工程、語義分析這些認(rèn)知智能層面的技術(shù)將再次興起?!?/span>
在眾多認(rèn)知智能技術(shù)中,自然語言處理被認(rèn)為是人工智能皇冠上的明珠,而知識(shí)圖譜則被認(rèn)為人工智能的基石,那么對于這兩項(xiàng)重要的認(rèn)知智能技術(shù),未來又會(huì)有哪些具體挑戰(zhàn)?
//
如何讓自然語言處理綻放光芒?
//
物理世界與數(shù)字世界之間的交互與交流,自然語言處理技術(shù)是必不可少。
筆者認(rèn)為自然語言處理一定會(huì)在未來得到更多發(fā)展和應(yīng)用。某種程度而言,自然語言處理正在重新定義人與機(jī)器,物理世界與數(shù)字世界之間的交互方式,過去依靠屏幕、鍵盤的交互方式,會(huì)越來越多被語音、動(dòng)作所取代,這時(shí)就需要自然語言處理來理解、判斷和推理。
事實(shí)上,自然語言處理技術(shù)已經(jīng)在不同行業(yè)的多項(xiàng)業(yè)務(wù)中得到了初步的使用,比如智能客服、智能翻譯、智能機(jī)器人等。但是,從目前來看,大部分的應(yīng)用的效果其實(shí)沒有符合大眾的期望值。業(yè)界也普遍認(rèn)為,自然語言處理依然存在著很大的挑戰(zhàn)。
百分點(diǎn)首席算法科學(xué)家蘇海波博士認(rèn)為,自然語言處理技術(shù)的突破的確是目前業(yè)界的巨大挑戰(zhàn)。在他看來,挑戰(zhàn)主要包括:帶標(biāo)識(shí)數(shù)據(jù)嚴(yán)重不足、文本遷移、文本推理、多模態(tài)融合的文本理解等等?!艾F(xiàn)階段,沒有通用的自然語言處理技術(shù)。自然語言處理四個(gè)層面主要為:形式、語義、推理和語用,現(xiàn)階段自然語言處理在從語義到推理的階段發(fā)展?!?/span>
蘇海波博士介紹:“在語料足夠豐富的場景下,比如智能問答、智能客服等,深度學(xué)習(xí)借助足夠的場景標(biāo)注語料,自然語言處理是可以達(dá)到不錯(cuò)的效果。但是百分點(diǎn)在大量實(shí)際客戶場景中發(fā)現(xiàn),用戶面臨最實(shí)際的問題就是如何在標(biāo)注樣本比較少的情況下,也能運(yùn)用好深度學(xué)習(xí)技術(shù),實(shí)現(xiàn)更佳的效果。”
根據(jù)蘇海波介紹,業(yè)界目前的趨勢是融合,希望利用融合來實(shí)現(xiàn)自然語言處理技術(shù)的突破,比如Google提出的BERT預(yù)訓(xùn)練語言模型,先去預(yù)先訓(xùn)練和學(xué)習(xí)很多知識(shí),然后融入到語言模型中,再結(jié)合用戶的具體場景,達(dá)到預(yù)想效果。“這種方式雖然標(biāo)注樣本較少,但是同樣可以達(dá)到非常好的效果?!?/span>
百分點(diǎn)首席算法科學(xué)家蘇海波博士
蘇海波博士介紹,百分點(diǎn)目前也積極在一些客戶的場景中采用這種思路去提升NLP效果,并且取得了非常不錯(cuò)的效果?!邦A(yù)訓(xùn)練語言模型類似遷移學(xué)習(xí)的思想,把之前的學(xué)習(xí)遷移到不同的場景中,這將在本質(zhì)上突破NLP?!?/span>
“自然語言處理的突破指日可待,未來它的黃金時(shí)代即將到來?!碧K海波博士表示。
//
知識(shí)圖譜:認(rèn)知智能的基石
//
如果說人工智能面臨兩大難題,一是人機(jī)交互,那另外一個(gè)就是行業(yè)知識(shí)、專家資源的匱乏。
這也是知識(shí)圖譜的價(jià)值所在。所謂知識(shí)圖譜,就是通過知識(shí)的關(guān)聯(lián)性形成一個(gè)網(wǎng)狀的知識(shí)結(jié)構(gòu),形成知識(shí)圖譜的過程本質(zhì)是在建立認(rèn)知,理解世界、應(yīng)用或業(yè)務(wù)。機(jī)器通過知識(shí)圖譜可以更智能地從客觀世界中獲得知識(shí),從而更加智能。
尤其是人工智能技術(shù)越往行業(yè)中下沉,越會(huì)面臨著專業(yè)數(shù)據(jù)、知識(shí)匱乏的難題,缺乏相關(guān)訓(xùn)練的數(shù)據(jù)來源。劉譯璟博士直言,傳統(tǒng)機(jī)器學(xué)習(xí)都是歸納的方法。如果在一個(gè)新的領(lǐng)域,缺乏足夠的數(shù)據(jù)將會(huì)面臨冷啟動(dòng)的問題,這時(shí)候就必須需要人的經(jīng)驗(yàn)和知識(shí),將對業(yè)務(wù)的理解和認(rèn)知告訴機(jī)器,這種對話就是知識(shí)圖譜,當(dāng)機(jī)器形成一定規(guī)模之后,就可以實(shí)現(xiàn)知識(shí)的共享。
“沒有人工,就沒有智能?!蹦壳埃ㄓ眯灾R(shí)圖譜已經(jīng)逐漸構(gòu)建成熟,而行業(yè)知識(shí)圖譜則剛剛興起。如何構(gòu)建一套適合這個(gè)行業(yè)比較有使用價(jià)值的知識(shí)圖譜,則必須借助業(yè)務(wù)專家。劉譯璟表示:“在一個(gè)具體行業(yè)中,不可能像通用知識(shí)圖譜那樣去實(shí)現(xiàn),必須借助業(yè)務(wù)專家,有了本體之后去對接數(shù)據(jù)和應(yīng)用?!?/span>
去年,百分點(diǎn)提出了動(dòng)態(tài)知識(shí)圖譜的概念。劉譯璟強(qiáng)調(diào),動(dòng)態(tài)知識(shí)圖譜核心價(jià)值在于動(dòng)態(tài),即人對于業(yè)務(wù)的理解不是一層不變的,這種理解隨時(shí)隨刻都可能發(fā)生改變,動(dòng)態(tài)知識(shí)圖譜就是可以快速反應(yīng)出人的這種認(rèn)知變化。
//
下一個(gè)十年:從這場發(fā)布會(huì)開始!
//
作為國內(nèi)企業(yè)級(jí)大數(shù)據(jù)+人工智能技術(shù)與應(yīng)用服務(wù)商,百分點(diǎn)一直走在人工智能應(yīng)用的最前沿,多年以來專注于大數(shù)據(jù)操作系統(tǒng)、智能認(rèn)知產(chǎn)品以及智能決策應(yīng)用場景的落地,并致力于大數(shù)據(jù)、人工智能技術(shù)在行業(yè)中的落地與應(yīng)用,在大數(shù)據(jù)、認(rèn)知智能技術(shù)積累了豐富的實(shí)踐經(jīng)驗(yàn)。
11月29日,百分點(diǎn)將發(fā)布基于大數(shù)據(jù)+認(rèn)知智能技術(shù)的最新產(chǎn)品、成立認(rèn)知智能實(shí)驗(yàn)室。此次新品的發(fā)布,這將會(huì)是百分點(diǎn)在大數(shù)據(jù)+人工智能領(lǐng)域的又一次沉淀。
對于認(rèn)知智能,一直走在實(shí)踐最前沿的百分點(diǎn)會(huì)給我們帶來什么驚喜,敬請期待!
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。