文|曾響鈴
來源|科技向令說(xiangling0815)
全面戰(zhàn)爭不斷深入的重要表現(xiàn),是局部的深度戰(zhàn)爭。
AI大競賽就是如此。5月15日,百度大腦召開了一場名為“與未來對話”的發(fā)布會,百度大腦“智能對話引擎”及其核心產(chǎn)品UNIT3.0亮相,智能對話在AI競賽中的位置全面提升。
事實上,自從語音、視覺在各個場景應(yīng)用中大放異彩后,AI一直在等待新的爆發(fā)點,現(xiàn)在,創(chuàng)新內(nèi)涵、應(yīng)用前景都十分豐富的智能對話開始接棒,包括百度在內(nèi),諸多大佬級AI平臺都盯上了智能對話。
以百度此次發(fā)布會為標(biāo)志,這個AI新的爆發(fā)點正式起爆,一場AI全面戰(zhàn)爭下的局部深度戰(zhàn)爭打響,而百度憑借AI技術(shù)的先期積累,已經(jīng)占據(jù)有利位置。
不過,對似乎提前鎖定勝局的百度而言,要以行業(yè)“引擎”的姿態(tài)做智能對話,下一步要面臨的挑戰(zhàn)也有不少。
“復(fù)雜系統(tǒng)”下,智能對話更需要開放式行業(yè)平臺
智能對話,從概念上看,其著眼點在“對話”,也即其AI能力擴展到了人機交互的更高層面——像人一樣進行對話式互動,而不只是下達和響應(yīng)被限定的命令。
這給了智能對話提出了更獨特的行業(yè)發(fā)展要求。
1、智能對話是一個“復(fù)雜系統(tǒng)”
目前,智能對話在車載、音箱、客服、機器人領(lǐng)域都有廣泛的應(yīng)用。普通人在網(wǎng)絡(luò)購物、享受服務(wù)的過程中,通過聊天框流暢對話的,很可能就是AI而非客服小姐。
不僅如此,現(xiàn)在的智能對話已經(jīng)能實現(xiàn)語音實時溝通,某些營銷電話的對接,可能就是由智能客服完成,而可以做到消費者渾然不知。
很明顯,這種“自然”對AI來說要求變得更高了。
與語音操作、視覺識別等成熟AI智能產(chǎn)品相比,要實現(xiàn)盡可能自然的對話,智能對話需要在NLP(自然語言處理,“聽見”講了什么詞組、句子)、知識圖譜(即AI懂的知識,只有“懂”才能去“聊”)、語音語義一體化(聽見的音節(jié)能轉(zhuǎn)化成現(xiàn)實的理解,沒有這個就好像不懂外語的聽外語)等方面都有深度積累。
智能語音無法通過簡單的數(shù)據(jù)+模型訓(xùn)練就能形成單個產(chǎn)品,在本質(zhì)上,它是一組技術(shù)和資源的總集成,需要全面的技術(shù)布局和深厚的技術(shù)積累,也因此,我們看到,智能語音在語音操作、視覺識別火了很久之后,才“姍姍來遲”迎來爆發(fā)。
2、做好智能對話,三個“池”缺一不可
正因為是“復(fù)雜系統(tǒng)”,所以做好智能對話,其能力需求也十分“立體”。
至少,這三個“池子”的條件平臺方必須具備:
首先,要有豐富的“資源池”。如同嬰兒學(xué)習(xí)對話,需要父母不斷進行輸入,更大量更多樣化的輸入才能讓嬰兒更快地實現(xiàn)語言能力成長。智能對話需要大量語料輸入,并不斷學(xué)習(xí)外界的“知識”。
然后,是強化學(xué)習(xí)能力的“技術(shù)池”。在輸入的基礎(chǔ)上,還得有消化能力,不管是新開發(fā)的AI技術(shù),還是通用AI技術(shù)的借用,智能對話的“復(fù)雜系統(tǒng)”都要求AI有更復(fù)雜的學(xué)習(xí)方式和學(xué)習(xí)過程.
最后,是能夠練手的“實踐池”。只有具備高密度的現(xiàn)實應(yīng)用,智能對話才能從“溫室”走出,適應(yīng)“社會環(huán)境”,沒有真刀真槍上陣,耍再多把式也沒用。
3、BAT級平臺被智能對話天然“預(yù)訂”
很顯然,有大量語料、知識庫,又具備充分的AI技術(shù)積淀,還有自家練手的場景應(yīng)用,全部具備三大“池”資源的只有BAT這樣的平臺級企業(yè),小公司幾乎不具備從零起步構(gòu)建智能對話產(chǎn)品的能力,或者說,投入太過巨大而沒有現(xiàn)實價值。
與簡單要求下的語音、視覺不同,智能對話從一開始就鎖定了BAT級平臺。
而這其中,正是憑借其技術(shù)領(lǐng)先、能力豐富的優(yōu)勢,百度大腦才能在這個爆發(fā)的節(jié)點上,發(fā)布其智能對話引擎;在此基礎(chǔ)上,百度大腦還針對對話系統(tǒng)定制平臺UNIT發(fā)布9大核心特性,形成了全新的對話系統(tǒng)定制平臺UNIT3.0。
相對于有所動作但幅度并不算大的A\T兩家AI平臺,百度智能對話已經(jīng)取得行業(yè)領(lǐng)先。
搜索出身給了百度巨大的先發(fā)優(yōu)勢。不論是天氣、星座、美食、快遞、團購、小說等信息資源,還是人物、地理、歷史體育等問答資源,都讓百度的智能對話有了業(yè)內(nèi)難以企及的語料和知識來源。
此外,AI戰(zhàn)略讓百度為智能對話積累了大量通用技術(shù)基底,以及快速上手的能力;而百度地圖、Apollo、DuerOS、小度機器人等“真實業(yè)務(wù)”又成為百度智能對話的練兵場,積淀了可以轉(zhuǎn)化到生態(tài)伙伴身上的大量預(yù)置技能(可以理解為經(jīng)過了廣泛“實習(xí)”)。
百度大腦為什么敢用“引擎”定義智能對話平臺?
值得一提的是,智能對話玩家們往往發(fā)布都在發(fā)布“XX平臺”、“XX產(chǎn)品”,而百度此次是直接用“引擎”來定義其智能對話平臺。
這固然有拔高競爭維度、強化相對優(yōu)勢的動機,但百度大腦敢這個爆發(fā)的關(guān)鍵節(jié)點用上“引擎”一詞,沒有起碼的實力是不敢這么高調(diào)的。
這里認(rèn)為,百度大腦能提出“引擎”,基于這三個方面的準(zhǔn)備:
1、稟賦上,智能對話平臺早已成型
某種程度上,百度此次的發(fā)布會并不是在發(fā)布一個“新產(chǎn)品”或“新平臺”,而更像是一次過去智能對話能力、產(chǎn)品、平臺、生態(tài)的整合與升級。
在今天正式發(fā)布智能對話引擎及其UNIT3.0之前,百度智能對話對自家產(chǎn)品、生態(tài)伙伴的賦能,已經(jīng)累計實現(xiàn)交互460億+次,而且這次百度大腦推出的UNIT3.0版本,在搭建技能、構(gòu)建知識和整合技能與知識上也做了全面升級,就技能搭建而言,包含預(yù)置技能和自定義技能。其中預(yù)置技能就包括智能問答、設(shè)備控制、影音休閑、生活服務(wù)等58大項,沉淀了全網(wǎng)最全面最優(yōu)質(zhì)的信息類資源。
可以說,百度的智能對話平臺已經(jīng)是全行業(yè)技術(shù)最強、能力最豐富、規(guī)模最大的平臺,這樣一個本身就具備業(yè)務(wù)基礎(chǔ)的平臺,再次升級只能是朝著更高的行業(yè)價值定位方向走。
從而,由“產(chǎn)品”或“平臺”轉(zhuǎn)向“引擎”也就自然而然了,畢竟,AI競賽尤其是平臺型AI之間的生態(tài)競爭,除了技術(shù)和商務(wù)的深入還會在定位上不斷升級維度。
可以預(yù)見,若干時間之后,A/T甚至科大訊飛也會跟上“引擎”的定位。
2、技術(shù)上,已實現(xiàn)快速冷啟動+高精度長尾優(yōu)化
在技術(shù)層面,百度智能對話引擎及其核心產(chǎn)品UNIT3.0有一個長達100多頁的PPT詳盡介紹其各類技術(shù)優(yōu)勢,其技術(shù)儲備的豐富與深度可見一斑(具體見相關(guān)報道)。
但總體看來,這里認(rèn)為,該引擎在技術(shù)上有兩個分階段的優(yōu)勢:部署后的快速冷啟動,運行過程中的高精度長尾優(yōu)化。
說白了,既然是引擎,“加速度”能力是十分重要的。
按百度方面的說法,其UNIT3.0能通過平均77個模板就能實現(xiàn)對話技能的快速冷啟動,對比行業(yè)需要高達800+模板;以地圖導(dǎo)航為例,百度大腦智能對話引擎通過10-100個模板、10-100個樣本就能快速啟動,實現(xiàn)90%的的準(zhǔn)確率。
這意味著,開發(fā)者和企業(yè)幾乎拿來就能滿足基本的需求,部署十分簡單,對環(huán)境要求不高。
而在冷啟動完成之后,智能對話的能力PK就轉(zhuǎn)移到第二個階段:精度的上限能到多少。
90%只是開始,100%只能無限接近。百度智能對話引擎目前已經(jīng)能實現(xiàn)95%的精度(即機器與人對話,95%是成功理解和互動的),注意,這不是普通的指令式語音互動,這個數(shù)字已經(jīng)在智能對話領(lǐng)域已經(jīng)遠(yuǎn)遠(yuǎn)高于多數(shù)玩家。
值得一提的是,精度從冷啟動到向上優(yōu)化的過程,本質(zhì)上是長尾的過程,在頻繁、大量的對話可能性之外,不斷覆蓋那些出現(xiàn)頻率不高的內(nèi)容。而這一過程仍然需要人力完成數(shù)據(jù)的歸納、標(biāo)注等動作(等于教會機器新鮮詞匯或詞組的現(xiàn)實意義)。
百度大腦智能對話引擎不僅在做AI的事,還幫助這種“人力”的節(jié)省。其DataKit等產(chǎn)品能夠大幅提升樣本生產(chǎn)和標(biāo)注效率,官方稱能把效率提升8倍(從16人/天到2人/天),這一定程度上解決了需要啃食數(shù)據(jù)的AI發(fā)展所自帶的人力瓶頸問題。
3、應(yīng)用上,擁有典型場景并繼承百度開放特質(zhì)
除了具體的數(shù)字,在實現(xiàn)場景上,百度大腦也在百度引以為傲的開放特質(zhì)下,完成了多個典型場景的敷設(shè)。
目前,百度智能對話引擎已經(jīng)在智能客服(中國聯(lián)動、南方電網(wǎng)、東方航空、浦發(fā)銀行、廣州銀行等)、消費電子(家教機、伴學(xué)機器人等)、車聯(lián)網(wǎng)(Apollo、小度車載OS平臺等,涵蓋上汽通過、福特等車企)等核心應(yīng)用領(lǐng)域進行深度應(yīng)用。
這些典型場景一方面是百度大腦智能對話引擎的實力證明,另一方面也在不斷外延的場景實踐中,進一步提升“引擎”的多面適用性,積攢推動更多場景前進的“馬力”。
在BAT甚至整個互聯(lián)網(wǎng)的競爭格局中,百度“最開放”的優(yōu)勢仍將保持下去,更多對智能對話有需求的開發(fā)者、企業(yè)方將能獲得平等、便捷的開放生態(tài)。
百度大腦智能對話生態(tài)這趟車,還會有更多“乘客”,這種預(yù)期下,把平臺定位為“引擎”也就順理成章。
強化“引擎”的生態(tài)推動力,百度大腦未來的三大看點
成為“引擎”不意味著結(jié)束——現(xiàn)實生活中的引擎往往都在追求更強的推力、更低的油耗,智能對話“引擎”也不例外。
要讓“引擎”獲得更強的生態(tài)推動力(也意味著百度獲得更強的競爭力),百度大腦還需要在這三個層面突破升級的關(guān)卡:
1、普惠化:讓高可用性智能對話實現(xiàn)低門檻獲取
AI終將成為全社會的基礎(chǔ)設(shè)施,智能對話的普惠化將是這個龐大基礎(chǔ)設(shè)施體系的一部分。
而技術(shù)的普惠化,往往又與技術(shù)的深度背道而馳。
霍金能夠用最后一片能動的肌肉實現(xiàn)打字、演講,靠的是IBM獨家提供的設(shè)備的強大技術(shù)實力。但這種技術(shù)的造價高昂,只能用于少數(shù)人身上。
智能對話比其他AI技術(shù)更復(fù)雜,決定了它的實現(xiàn)難度更大,所需投入的資源也更多,普惠化面臨巨大的門檻壓力。而高可用性的智能對話,最終目標(biāo)一定是實現(xiàn)“圖靈測試”突破,人人可享用真正智能化的對話機器人,聽起來并不“便宜”。
于是,如何降低門檻就成了關(guān)鍵詞。
百度智能對話引擎的龐大預(yù)置技能,以及快速冷啟動、智能化人工標(biāo)注,都是降低智能對話應(yīng)用門檻的動作。在百度智能客服人工智能3.0的規(guī)劃中,“限定輪次”實現(xiàn)“圖靈測試”被寫入,這說明,在“引擎”階段就盡量實現(xiàn)技術(shù)的簡單易行,將是普惠化的可行方式。
2、定制化:多級生態(tài)模式滿足不同深度的智能對話需求
既然是生態(tài),智能對話繞不過的問題一定有定制化與標(biāo)準(zhǔn)化的協(xié)同問題。
平臺提供的產(chǎn)品往往以標(biāo)準(zhǔn)化內(nèi)容為主,如此在商業(yè)上更易于實現(xiàn)規(guī)?;欢蛻舻男枨笸鶐в写罅康膫€性化內(nèi)容,這樣才能更好地匹配只屬于自己的用戶/消費者實際。
又要標(biāo)準(zhǔn)化、又要定制化,是“平臺”們面臨的共同難題,也是鉗制生態(tài)規(guī)模的重要因素。
從這個角度看,百度大腦智能生態(tài)引擎在具體技術(shù)內(nèi)容上,提供的一些工具或模塊,就在嘗試解決這類問題。
例如,UNIT3.0內(nèi)嵌一個稱為US Kit的開源中控模塊,能無縫對接UNIT平臺能力,在此基礎(chǔ)上快速生產(chǎn)定制化對話中控,且開源架構(gòu)能夠不斷延展、支持添加各種新能力。
用大白話說,開發(fā)者能夠通過配置各種標(biāo)準(zhǔn)化技能(接入多個對話場景),快速搭建和定制符合自己業(yè)務(wù)場景的對話中控,這種對“標(biāo)準(zhǔn)化”的整合與統(tǒng)一,反過來又現(xiàn)實了屬于開發(fā)者的定制化對話服務(wù)。
3、共贏化:用對話服務(wù)模式的變革推動全產(chǎn)業(yè)升級
為了強調(diào)“對話技術(shù)進入工業(yè)級落地的各項基礎(chǔ)條件已具備”,百度方面用了這樣一些數(shù)據(jù):38%的企業(yè)已應(yīng)用基于智能對話的系統(tǒng);44%的企業(yè)計劃在2年內(nèi)使用智能對話;83.3%企業(yè)認(rèn)為智能對話能有效降低運營成本;78.6%的企業(yè)認(rèn)可智能對話能改善客戶體驗……
事實上,換個角度看這些數(shù)據(jù):對話服務(wù)方式的改變,使得智能對話引擎某種程度上成為產(chǎn)業(yè)升級浪潮的助力,而不再僅僅是平臺、企業(yè)、開發(fā)者之間的AI商業(yè)互動。
為產(chǎn)業(yè)中某企業(yè)服務(wù)的智能對話引擎,在事實上加速著企業(yè)(并通過企業(yè)改變產(chǎn)業(yè)本身)與互聯(lián)網(wǎng)信息時代融合的速度,在這個過程中,由于客戶體驗的改變、信息溝通反饋的便捷,企業(yè)以及產(chǎn)業(yè)的悶頭干活的發(fā)展方式也將被改變。
而這,正是產(chǎn)業(yè)升級的內(nèi)容。
智能對應(yīng)引擎所形成的行業(yè)生態(tài)從客服等職能切入,但溝通方式改變對許多產(chǎn)業(yè)的影響卻是整體的。百度大腦的智能對話引擎,不僅僅在形成百度自己的AI垂直生態(tài),也在用對話服務(wù)模式的變革推動全產(chǎn)業(yè)升級。
*此內(nèi)容為【科技向令說】原創(chuàng),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
【完】
曾響鈴
1鈦媒體、品途、人人都是產(chǎn)品經(jīng)理等多家創(chuàng)投、科技網(wǎng)站年度十大作者;
2虎嘯獎高級評委;
3作家:【移動互聯(lián)網(wǎng)+ 新常態(tài)下的商業(yè)機會】等暢銷書作者;
4《商界》《商界評論》《銷售與市場》等近十家雜志撰稿人;
5鈦媒體、界面、虎嗅等近80家專欄作者;
6“腦藝人”(腦力手藝人)概念提出者,現(xiàn)演變?yōu)椤白悦襟w”,成為一個行業(yè)。
7現(xiàn)為“今日頭條問答簽約作者”、多家科技智能公司傳播顧問。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準(zhǔn)AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。