語音并不是一個新鮮事物,2011年,Siri被內(nèi)置在iPhone 4s之中橫空出世時,曾掀起一波語音技術(shù)和討論熱潮和語音助手的創(chuàng)業(yè)熱潮。時隔五年之后,Google AlphaGo人機大戰(zhàn)將AI(人工智能)從實驗室技術(shù)變成坊間熱議的話題,人工智能成為國內(nèi)外科技巨頭的爭奪焦點,語音則成為巨頭進軍AI的必經(jīng)之路。
Google I/O大會上,最重要的項目便是Google Assistant(谷歌助理)和Google Home(類似于Amazon Echo的智能家庭音箱助手),Google Home的基礎(chǔ)則是語音。
蘋果WWDC開發(fā)者大會上,5歲的Siri終于兼容了Mac,并向開發(fā)者開放,能完成更多任務(wù)。
Amazon Echo成為Amazon 最成功的硬件產(chǎn)品,這款產(chǎn)品銷量已達到400萬,家庭智能語音音箱,被視作是智能手機之后的又一個爆款品類。
KPCB合伙人、享有“互聯(lián)網(wǎng)女皇”稱號的瑪麗·米克爾在今年的互聯(lián)網(wǎng)趨勢報告中,將超過十分之一的篇幅給了“語音”二字,在其看來,“觸摸屏+麥克風(fēng)”正在取代“鍵盤+鼠標”的交互方式。
如此重要的技術(shù)革命,中國巨頭自然不會缺席。截止目前,中國市場還沒有與Amazon Echo媲美的中國版智能語音音箱,但在軟件層面互聯(lián)網(wǎng)公司卻一直在想方設(shè)法入局。Siri發(fā)布的第二年,搜狗便發(fā)布了語音助手,搜狗也是中國最積極投資語音的互聯(lián)網(wǎng)巨頭之一,阿里、騰訊、網(wǎng)易、京東等巨頭在語音上雖然偶爾有零星動作,但并未將之視作重點,要么是第三方合作,要么是蜻蜓點水。搜狗是搜索引擎,均崇尚技術(shù),這是其押注語音的原因所在。
輸入成中國玩家進軍語音的亮點
輸入是語音最典型的應(yīng)用場景,戶外、家里、走路、開車,人們有許多時候都不便于打字,或者說懶得打字,抑或打字效率不夠高,語音就成為一種選擇。隨著語音技術(shù)的發(fā)展,識別準確率、方言兼容度、噪音抗干擾諸多難題都已得到解決,語音識別率已達到實用水平。
在語音輸入法上,搜狗輸入法、訊飛輸入法和百度輸入法是最主要的三個玩家。科大訊飛憑借著語音技術(shù)切入輸入法領(lǐng)域,宣稱用戶數(shù)已過億;百度輸入法也將語音當做亮點,其宣稱借助于DeepSpeech技術(shù)解決了噪音問題。語音輸入量工具最大的則是搜狗輸入法,其7%的用戶會用到語音識別功能,這一功能每天會有超過1億次的語音轉(zhuǎn)化量,在整體1.4億的請求次數(shù)中占據(jù)相當比例,這也側(cè)面表明,搜狗語音應(yīng)用最關(guān)鍵還是輸入。
搜狗輸入法做語音則有5年歷史,與訊飛語音輸入法強調(diào)識別率不同,搜狗輸入法更強調(diào)智能輸入。識別率再高,語音輸入依然會有錯字現(xiàn)象,手工更改成痛點——用語音輸入就是因為不想動手。搜狗輸入法的解決方案是智能交互,比如用戶說“航天一院”很可能被識別為“航天醫(yī)院”,用戶就可再說“一二三四的一”,搜狗輸入法就會將“醫(yī)”改為“一”。這樣的交互能實現(xiàn),關(guān)鍵不在于識別率,而是語義理解,如果沒有語義理解技術(shù),就會直接將“一二三四的一”轉(zhuǎn)化為文字。好的語義理解,需要應(yīng)用深度學(xué)習(xí)為基礎(chǔ)的人工智能技術(shù),這是互聯(lián)網(wǎng)公司尤其是搜索公司擅長的地方。
語音輸入法成為中國互聯(lián)網(wǎng)巨頭做語音的一大亮點,美國用戶并不需要“輸入法”,系統(tǒng)自帶功能就可滿足,因此美國并沒有類似于搜狗這樣的輸入法巨頭。當然,英文會需要語音輸入,不過這并沒有成為Siri的重點,未來或許會出現(xiàn)英文版的語音輸入法。
汽車成中國巨頭最親睞的場景
在語音使用場景方面,美國科技巨頭更親睞“家”,Amazon Echo、Google Home均是面向家庭這一場景。家是封閉空間,相對更安靜,并且干擾他人和被他人干擾的問題更小,還能與智能家居打通,是非常適合的語音場景。不過,由于做硬件需要較強的“硬實力”,與智能家居打通則需要大量的產(chǎn)業(yè)整合,不是一時半會能實現(xiàn)的,因此中國互聯(lián)網(wǎng)巨頭均對這個場景望而卻步,阿里、京東有嘗試與第三方合作推出與Echo類似的產(chǎn)品,市場表現(xiàn)卻很平淡。
與“家”同等重要的語音場景非汽車莫屬:車主在駕駛時雙眼和雙手都被占用,語音成為最佳輸入方式。過去汽車內(nèi)的語音輸入存在許多痛點,自帶語音功能只支持少數(shù)英文命令,并且還要給更多錢買“豪華版”才會配置。汽車內(nèi)的語音交互充滿著互聯(lián)網(wǎng)巨頭最向往的顛覆機會。
搜狗針對汽車發(fā)布了智能語音導(dǎo)航App,可實現(xiàn)駕駛之外的常規(guī)車內(nèi)交互,包括打電話、發(fā)短信、查天氣、歌曲播放等等,這款產(chǎn)品可運行在智能手機上,還可通過車機互聯(lián)協(xié)議使之運行于汽車屏幕,如果汽車廠商與搜狗進行前裝合作則可獨立運行于汽車的OS上。不久前,YunOS與上汽合作的國內(nèi)首款互聯(lián)網(wǎng)汽車,語音交互被當做一個賣點:阿里巴巴CEO張勇展示了用語音打開天窗這樣的操作。在未來,汽車內(nèi)的語音交互將成為標配。
智能技術(shù)確保語音能夠聽得懂
Siri才五年歷史,但語音卻有十分悠久的歷史:科大訊飛在1999年就已成立,現(xiàn)在是A股市場上市值400億元的語音巨頭。不過,語音走向大眾,徹底改變?nèi)藱C交互方式,卻是近幾年才發(fā)生的事情。從國內(nèi)外科技巨頭的動作來看,智能技術(shù)和云端服務(wù)已成為語音的兩大支柱。
語音技術(shù)過去是基于“規(guī)則”而不是“統(tǒng)計”,基于一定規(guī)則,對海量的語料庫進行處理之后就能不斷提高識別準確率。深度學(xué)習(xí)為基礎(chǔ)的人工智能技術(shù)加入之后,語音技術(shù)就變成通過機器集群去學(xué)習(xí)海量語料數(shù)據(jù),并尋找到各種規(guī)律,進而進行準確的語音識別和語義理解。
不論是語音輸入的智能糾錯,還是語音搜索對用戶請求的準確理解,抑或Siri響應(yīng)用戶諸如“幫我設(shè)置一個提醒,明天9:00取快遞”這樣的復(fù)雜命令,底層均是人工智能技術(shù),AlphaGo掀起的AI啟蒙運動則將會成為語音普及的助力。
搜狗與清華大學(xué)聯(lián)合成立“天工智能實驗室”,正在人工智能技術(shù)這個“根”上布局,以求贏在起跑線上。借助于人工智能技術(shù),搜狗宣稱語音識別準確率高于97%,識別速度高達每分鐘400字以上,在語音修改方面,支持替換、插入、刪除等幾百種改錯操作 ,修改成功率達到90%以上,處于行業(yè)領(lǐng)先水平。
云端服務(wù)則決定語音能夠做什么
智能技術(shù)確保了人與機器能夠順暢地對話和交互。云端服務(wù)整合能力,則決定機器在聽懂人話之后能做什么。
Siri相比Google Now的劣勢是,許多Siri無法回答的問題,Google Now可通過搜索解決。Amazon Echo之所以有很大價值,在于其能夠去Amazon網(wǎng)站下單購物。這些均體現(xiàn)了云端的服務(wù)整合能力,正是意識到這一點的重要性,今年的WWDC上蘋果決定開放Siri給開發(fā)者,讓開發(fā)者來豐富Siri的服務(wù)。
云端服務(wù)上,搜狗擁有搜狗地圖、搜狗搜索、搜狗號碼通、搜狗問問、搜狗百科等產(chǎn)品,未來搜狗語音還可整合其伙伴如京東、知乎、騰訊的諸多服務(wù),比如QQ音樂、騰訊視頻、京東購物等等,甚至用語音給微信好友點個贊。相對來說,互聯(lián)網(wǎng)巨頭云端服務(wù)整合能力更強,搜索引擎憑借著強大的內(nèi)容整合和服務(wù)連接能力表現(xiàn)又更突出。
僅僅是整合“在線服務(wù)”并不足夠,互聯(lián)網(wǎng)巨頭要做語音,下一步重點將是努力去與實體世界服務(wù)實現(xiàn)整合,比如讓用戶能夠通過語音訂外賣,可以通過語音打開門禁,通過語音來打開車窗……整合方式有兩種方向:一種是手機App與各種服務(wù)連接起來;還有一種是語音inside各種硬件之中,例如機器人,汽車等等。總之,整合實體世界服務(wù)之后,語音就不會只是回答用戶的問題,而是要幫助用戶完成任務(wù),成為全能助理。
語音市場在AlphaGo掀起人工智能熱潮之后又迎來新的發(fā)展契機,語音正在徹底顛覆人與機器的交互方式,百度和搜狗為代表的中國科技巨頭正在輸入、汽車等場景上尋求突破,在智能技術(shù)和云端服務(wù)上進行雙重布局。不過,要讓麥克風(fēng)取代鍵盤,科技巨頭還有很長的路要走,可謂任重道遠。
微博@互聯(lián)網(wǎng)阿超 微信 羅超(luochaotmt)
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。