說到人工智能技術,人們首先會聯(lián)想到深度學習、機器學習技術;談到人工智能應用,人們很可能會馬上想起語音助理、自動駕駛等等,不過,在AI World 2017世界人工智能大會上,百度副總裁、AI技術平臺體系(AIG)總負責人王海峰卻沒有講這些,這次他聊的是知識圖譜。
雖然你可能說不出知識圖譜的具體定義,但其實每天都在使用它。當你在百度搜索時,搜索結果右側的聯(lián)想,就來自于知識圖譜技術的應用;你問百度某個字怎么念,答案也來自知識圖譜的應用;你和度秘聊天,問他詹姆斯和科比誰厲害、都取得了哪些成就等等,背后都是知識圖譜在發(fā)揮作用……王海峰在演講中甚至表示,百度搜索、地圖、金融……越來越多的應用,都越來越依賴知識圖譜。
聽完王海峰的演講,我的第一個反應就是:知識圖譜的價值被行業(yè)低估了,各行各業(yè)都在研發(fā)底層技術和尋求AI場景,卻忽視了最成熟也很重要的AI技術:知識圖譜。
知識圖譜跟人工智能有什么關系?
知識圖譜不難理解——就是通過不同知識的關聯(lián)性形成成一個網(wǎng)狀的知識結構,對機器來說就是圖譜,形成知識圖譜的過程本質(zhì)是在建立認知,理解世界,理解應用的行業(yè)或者說領域,每個人都有自己的知識面,或者說知識結構,本質(zhì)就是不同的知識圖譜,正是因為有獲取和形成知識的能力,人類才可以不斷進步。
王海峰認為,知識圖譜對于人工智能的重要價值在于,知識是人工智能的基石。機器可以模仿人類的視覺、聽覺等感知能力,但這種感知能力不是人類的專屬,動物也具備感知能力,甚至某些感知能力比人類更強,比如狗的嗅覺。而 “認知語言是人區(qū)別于其他動物的能力,同時,知識也使人不斷地進步,不斷地凝練、傳承知識,是推動人不斷進步的重要基礎?!?而知識對于人工智能的價值就在于,讓機器具備認知能力。
知識對于AI的價值,王海峰的總結是兩者結合可以正循環(huán):
“有了知識的人工智能會變得更強大,可以做更多的事情。反過來,因為更強大的人工智能,可以幫我們更好地從客觀世界中去挖掘、獲取和沉淀知識,這些知識和人工智能系統(tǒng)形成正循環(huán),兩者共同進步?!?/p>
在此之前,人工智能的基礎是什么?行業(yè)有不同聲音,比如馬云說數(shù)據(jù)就是未來的能源,與云計算和互聯(lián)網(wǎng)一起構成智能世界的基礎;李彥宏說算法很重要,數(shù)據(jù)秒殺算法;馬化騰說AI的四個要素是數(shù)據(jù)、場景、計算力和人才。總體來說,數(shù)據(jù)和算法是大家認為比較基礎的東西。王海峰從技術層面將將AI核心技術分為感知層與認知層,提出認知層的基礎是知識的觀點,與行業(yè)的看法并不矛盾。因為知識圖譜的基礎,就是數(shù)據(jù)和算法,它需要應用自然語言處理和深度學習技術來進行數(shù)據(jù)挖掘,在海量知識中找出關聯(lián)性,形成圖譜。
為什么王海峰如此重視知識圖譜技術?
構建知識圖譜這個過程的本質(zhì),就是讓機器形成認知能力,理解這個世界。事實上,現(xiàn)在機器的感知能力已經(jīng)越來越接近于人類了,語音識別準確率達到97%甚至更高,圖像識別某些領域如人臉識別,比人類個體更加準確和迅速。所以,未來人工智能的重點進步方向?qū)⑹钦J知層,機器理解這個世界,才能更好地與世界交互,為人類服務。百度是中國最積極和大力布局人工智能的科技巨頭,作為百度人工智能技術體系的最高負責人,王海峰重視知識圖譜也表明百度未來會強化機器認知能力。
當然,王海峰為什么如此重視知識圖譜,還有兩層不容忽視的原因。
第一,王海峰本人的研究方向和從業(yè)經(jīng)歷決定他是務實派。
王海峰不是從研究學者轉型而來的技術管理者,而是學術和工程并舉,從實踐中成長起來的科學家。王海峰2010年加入百度時,這一輪AI熱還沒爆發(fā),即便是最早布局AI的百度,成立深度學習實驗室也是在2013年。王海峰加入百度后,先后為百度創(chuàng)建了自然語言處理部、互聯(lián)網(wǎng)數(shù)據(jù)研發(fā)部(包括知識圖譜和互聯(lián)網(wǎng)數(shù)據(jù)挖掘)、推薦引擎和個性化部、多媒體部(包括語音和圖像技術)、圖片搜索部、語音技術部等。
不難發(fā)現(xiàn),百度最核心的AI相關技術王海峰都有經(jīng)手甚至牽頭主導,與自動駕駛等技術的不同之處在于,這些技術都是直接影響上億用戶的應用型技術,而且相當一部分與知識圖譜有直接或間接關系。2013年上半年,王海峰作為執(zhí)行負責人協(xié)助創(chuàng)建了百度深度學習研究院(IDL),百度正式進入AI行業(yè),他此前幾年為百度布局的技術,為百度進入AI領域打下了基礎。我想正是這幾年讓王海峰的技術研發(fā)更偏應用性,注重實用價值,今天提出“知識圖譜對AI是基石”也許與這個思維方式有關系。
王海峰在學術上也居于大師級地位。在自然語言處理領域,他是世界上影響力最大的國際學術組織ACL(計算語言學協(xié)會)最年輕的會士,也是ACL 50多年來唯一的華人主席。百度搜索、翻譯、語音、輸入法以及知識圖譜等等產(chǎn)品,都是基于NLP技術。因為在人工智能上的成就,王海峰在今年5月還獲得了國家級科技獎“全國創(chuàng)新爭先獎”。
無論是作為百度AIG的負責人,還是學術大師,王海峰看重知識圖譜的價值都不奇怪。
第二,百度很早便在知識圖譜上進行布局,儲備充分。
百度很早就在研發(fā)知識圖譜技術。2014年開始,百度在搜索中將知識圖譜產(chǎn)品規(guī)?;瘧?,3年應用量增加了160倍,百度的知識圖譜的知識點已經(jīng)達到幾個億;在技術層面,百度知識圖譜技術已經(jīng)實現(xiàn)了動態(tài)技術,每天有幾百個數(shù)據(jù)流同時工作,支持秒級更新和多層查詢。世界是變化的,百度知識圖譜對世界的認知也是變化的,動態(tài)知識圖譜,需要很強的數(shù)據(jù)、算法和計算基礎。
百度知識圖譜不只是被應用在搜索系產(chǎn)品中(包含問答、百科等),DuerOS、信息流、甚至以圖搜圖,都在應用知識圖譜。王海峰在演講中透露,百度知識圖譜已經(jīng)應用到幾十個領域。我記得2015年,百度還將知識圖譜應用在股票領域,旗下產(chǎn)品股市通通過數(shù)據(jù)、信息與股票的關系,以及股票與股票之間的關系,在股票領域首創(chuàng)知識圖譜,實現(xiàn)智能選股。
可以說,百度在知識圖譜上已經(jīng)在數(shù)據(jù)、算法、計算和場景上形成了優(yōu)勢,這也是百度被嚴重低估的一個優(yōu)勢。算法、數(shù)據(jù)、計算力,每家公司都有,但在知識上百度卻是積累最豐富的,不只是狹義的百科、知道、文庫等等知識產(chǎn)品,搜索引擎與用戶交互的過程本身也是在完善知識體系。所以百度自然要用其擅長的知識圖譜,去強化在AI領域的優(yōu)勢,尤其是機器認知能力和應用價值。
知識圖譜成為AI應用行業(yè)的先決條件
人工智能已受到各行各業(yè)的關注,不只是BAT在戰(zhàn)略投資人工智能,金融、汽車、零售、娛樂、制造等等行業(yè)都在積極擁抱人工智能技術。然而,人工智能要在行業(yè)中得到應用的先決條件,首先要對行業(yè)建立起認知,只有理解了行業(yè)和場景,才能真正智能化。說白了,就是要建立行業(yè)知識圖譜,才能給行業(yè)AI方案。
一個例子是零售行業(yè),如果真要實現(xiàn)個性化的商品推薦,機器必須理解不同商品的特性,以及商品與銷售場景(如季節(jié)、地區(qū)、時段)、與促銷行為(打折、送券)、與用戶需求之間的關系,才能推薦滿足用戶需求的產(chǎn)品。這也是一個優(yōu)秀的推銷員或商場導購的思考邏輯。然而,要理解這些要素之間的聯(lián)系,就必須構建零售行業(yè)的知識圖譜,且需要不斷動態(tài)學習來完善認知,才能進行有效的推薦,這就是“零售知識圖譜”。當然,針對不同的零售細分領域,比如美妝、3C、食品等,可能又要建立完全不同的知識圖譜,就像人類社會的細分一樣,在每個行業(yè)都建立起特有的知識圖譜。
類似邏輯同樣適用于客服、金融、制造、娛樂等場景,總而言之,人工智能要在一個行業(yè)得到應用的前提,就是要讓機器建立起對應行業(yè)的認知,形成行業(yè)知識圖譜。王海峰在演講中也指出,
“人工智能與傳統(tǒng)產(chǎn)業(yè)融合的過程中,要想為這個行業(yè)提供更好的服務,就需要對這個行業(yè)進行定制化,要有行業(yè)知識,這時候就需要在通用知識圖譜的基礎上,有相應的行業(yè)知識圖譜,進而幫助這個行業(yè)提升生產(chǎn)力,幫助這些行業(yè)、產(chǎn)業(yè)升級?!?/p>
王海峰的邏輯,也是未來人工智能走向應用的必經(jīng)之路:機器通過人工智能技術與用戶的互動,從中獲取數(shù)據(jù)、優(yōu)化算法,更重要的是構建和完善知識圖譜,認知和理解世界,進而服務于這個世界,讓人類的生活更加美好。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。