7月28日,百度公布2017年二季度財(cái)報(bào),本季度營收208.74億人民幣,同比增長14.3%,凈利潤44.15億人民幣,同比增長82.9%。穩(wěn)健業(yè)績之外,百度對(duì)話式人工智能系統(tǒng)DuerOS的表現(xiàn)也令人矚目。財(cái)報(bào)顯示,DuerOS已經(jīng)廣泛賦能移動(dòng)通訊、智能家居、穿戴、車載等多個(gè)行業(yè),引起了足夠多的企業(yè)關(guān)注。
事實(shí)上,整個(gè)7月,互聯(lián)網(wǎng)圈都在被“語音交互”這個(gè)概念圍繞。我們可以好好梳理一下7月以來以“語音交互”為核心的人工智能項(xiàng)目:
7月5日,百度AI開發(fā)者大會(huì)上,DuerOS開放平臺(tái)誕生;
7月8日,搭載DuerOS的美的智能語音盒發(fā)布;
7月12日,繼長沙之后,搭載DuerOS的中信國安廣視G-1智能機(jī)頂盒落地河北;
7月19日,阿里發(fā)布智能音箱“天貓精靈”;
7月25日,搭載DuerOS的新款極米無屏電視發(fā)布;
7月26日,小米發(fā)布“小米AI音箱”;
7月28日,搭載DuerOS的TCL智能電視在Chinajoy展出。
人工智能的浪潮似乎從未來得如此之快。搭載移動(dòng)互聯(lián)網(wǎng)的是移動(dòng)操作系統(tǒng)以及手機(jī)等便攜式硬件設(shè)備。那么人工智能來臨之時(shí),究竟什么平臺(tái)才能搭載基于人工智能的軟硬件呢?
為什么承載人工智能的會(huì)是語音交互
從百度、阿里、小米的做法來看,語音交互可能會(huì)是搭載人工智能的重要平臺(tái)。特別是百度,DuerOS中“OS”這個(gè)字眼,幾乎可以看透百度的意圖——希望在人工智能的生態(tài)環(huán)境中,充當(dāng)“操作系統(tǒng)級(jí)別”的平臺(tái)。
但我們?cè)谑煜ゆI鼠、點(diǎn)觸之后總是無法理解,為什么語音交互會(huì)如此重要?
(智能語音產(chǎn)業(yè)鏈)
首先,語音交互是人類最自然的交互方式、門檻最低的信息獲取方式。人工智能的使命是為人類帶來更加便利、智慧的生活,而語音交互將徹底解放雙手,為不同年齡、不同教育水平的用戶帶來了同樣便利的服務(wù)。
第二,人和語音的交互本質(zhì)正在發(fā)生變化。語音交互在人工智能和大數(shù)據(jù)環(huán)境下,可調(diào)用的數(shù)據(jù)非常龐大,大數(shù)據(jù)的積累,以及遠(yuǎn)程計(jì)算能力的提升,提升了語音交互的效率。
當(dāng)你對(duì)語音助手說“從常營去望京要多長時(shí)間”時(shí),語音助手可能會(huì)告訴你“大約需要40分鐘,東五環(huán)XX路以及XX路有擁堵”。一個(gè)看似簡單的對(duì)話,這里面需要調(diào)度的數(shù)據(jù)包括地圖上的交通信息以及車輛行駛信息等一系列非結(jié)構(gòu)化的復(fù)雜數(shù)據(jù),這些數(shù)據(jù)來源于具備可視性、劃分層級(jí),而且直觀易懂的信息環(huán)節(jié)。
只需動(dòng)動(dòng)嘴皮子,人工智能便從云端數(shù)據(jù)庫中迅速調(diào)度各種服務(wù),為你提供有效信息,這個(gè)時(shí)候,語音交互的合理性顯然無可替代。這也就是為什么承載人工智能的會(huì)是語音交互。
語音交互需要突破軟件硬件兩個(gè)生態(tài)
當(dāng)然,語音交互目前只是在某些場景下效率更高,更多情況還是信息量太少、效率太低。否則Siri,Google Now,Cotana早就取代了點(diǎn)觸和鍵盤鼠標(biāo)。
語音交互能否成為主流的交互方式,主要需要解決兩個(gè)問題。
第一,如何覆蓋更多的場景。
簡單說,就是能不能讓你隨時(shí)隨地都能用語音來獲取各式各樣的服務(wù)。目前智能語音覆蓋的服務(wù)明顯不足,很多場景智能語音完全缺位甚至是割裂的。
比如說,當(dāng)我對(duì)我的iPhone說給我訂一份外賣時(shí),Siri只會(huì)撒潑打滾賣萌,無法提供有價(jià)值信息。由于各平臺(tái)之間的隔閡,一部手機(jī)上想用語音喚醒服務(wù)操作不同應(yīng)用,可能需要調(diào)用多個(gè)語音助手服務(wù)。
第二、如何讓信息接受更輕松、高效。
簡單說,要聽清、聽懂、滿足需求。打個(gè)比方,我用iPhone的Siri功能導(dǎo)航,當(dāng)我說我想去國家會(huì)議中心的時(shí)候,首先要喊Siri喚醒它,然后說我想去國家會(huì)議中心,Siri腦殘地回復(fù)“我找到一個(gè)叫天辰東路7號(hào)的國家會(huì)議中心,是這個(gè)嗎”,你要說是的,Siri再幫你尋找地址,這樣的語音服務(wù)體驗(yàn)既費(fèi)時(shí)又費(fèi)力。
(Siri的導(dǎo)航步驟)
不得不說,同樣的情景,由DuerOS能力加持的小度助手評(píng)測效果更佳。今年5月,HTC發(fā)布全球旗艦新機(jī)U11,中國大陸地區(qū)搭載的語音助手就是小度助手,不僅能提供美食、交通、氣象、教育等多領(lǐng)域的實(shí)時(shí)信息,還支持多輪交互,滿足用戶實(shí)際使用習(xí)慣。
對(duì)用戶來說,一個(gè)統(tǒng)一的語音操作系統(tǒng)橫行所有應(yīng)用,在汽車、家庭、手機(jī)之間貫通,而且高效、快捷、省心,這才是驅(qū)動(dòng)他們使用智能語音的理想水平。這些問題的解決必須在軟件和硬件這兩個(gè)生態(tài)層面去思考。
硬件層面需要有足夠的硬件廠商,甚至要聯(lián)合芯片廠商,形成“交鑰匙”的方案,讓用戶隨時(shí)隨地只用一個(gè)語音操作系統(tǒng)就能解決問題。其次,軟件層面需要有足夠的開發(fā)者、足夠的服務(wù)接入,讓用戶能夠通過語音享受到衣食住行等各式各樣的服務(wù)。
百度DuerOS恰恰是沿著這兩條路來解決這個(gè)問題。向傳統(tǒng)硬件廠商和開發(fā)者輸出軟硬兼?zhèn)涞亩鄬哟谓鉀Q方案。
(DuerOS的解決方案)
在硬件生態(tài)層面上,建立智能設(shè)備開放平臺(tái)。提供多層級(jí)解決方案,降低開發(fā)成本,做到聽清、聽懂,包括音響、電視、冰箱、機(jī)器人、玩具、車載、移動(dòng)設(shè)備、手機(jī)、耳機(jī)等優(yōu)秀的硬件設(shè)備制造商都囊括在了DuerOS硬件生態(tài)的體系之中。
在軟件生態(tài)層面上,建立技能開放平臺(tái)。DuerOS自有10大類、100余種原生技能,還支持接入第三方資源和內(nèi)容,如音樂、有聲、新聞、娛樂等,將為用戶提供豐富的應(yīng)用服務(wù),滿足用戶多樣化的服務(wù)需求。
為了能夠讓數(shù)據(jù)流通,DuerOS甚至還聯(lián)合ARM、紫光展銳和漢楓發(fā)布承載了百度對(duì)話式人工智能系統(tǒng)的DuerOS智慧芯片。芯片功耗低、吞吐率低,以音頻連接為主。要知道這些廠商都具備豐富的物聯(lián)網(wǎng)技術(shù)。掌握芯片和智能語音技術(shù),未來很可能會(huì)掌握物聯(lián)網(wǎng)的入口。
正如百度度秘事業(yè)部總經(jīng)理景鯤在百度AI開發(fā)者大會(huì)上所說:“DuerOS作為百度在人工智能時(shí)代最重要的開放平臺(tái)之一,希望通過開放賦能,喚醒萬物。”而DuerOS一系列的做法也正是在軟件、芯片兩個(gè)維度上為軟硬件廠商提供了一攬子的解決方案。
這種解決方案如“交鑰匙”一樣,任何廠商需要用到語音交互和語音識(shí)別,都可以“拎包入住”,所有場景、應(yīng)用都可以輕松圍繞語音展開,真正實(shí)現(xiàn)喚醒萬物。
如果非要找到一個(gè)中心,那就是你的語音
2016年8月,當(dāng)時(shí)還在微軟擔(dān)任全球副總裁的陸奇曾撰寫了一篇名為《關(guān)于人工智能,我們可能做對(duì)了一些事》的文章。文中曾有這樣一句話:
早在PC普及和搜索引擎崛起的時(shí)候,人們并不是像今天這樣用鍵盤和鼠標(biāo)和機(jī)器對(duì)話、在搜索框里用關(guān)鍵字來搜索的。人們最初的體驗(yàn),是直接和電腦說話、在搜索引擎里輸入完整的對(duì)話。只是因?yàn)楫?dāng)時(shí)的技術(shù)條件不具備,才使人們不得不去學(xué)著使用機(jī)器能理解的輸入方式和關(guān)鍵詞來找到自己所需的東西。對(duì)話自始至終都是最自然的交互形式,只是當(dāng)時(shí)還不具備條件而已。今天,我們終于具備了對(duì)話即平臺(tái)的條件。
在陸奇看來,人工智能的時(shí)代在數(shù)據(jù)量、用戶連接和技術(shù)條件集大成之后,核心革命是“Conversations as a Platform”,也就是對(duì)話即平臺(tái)。
隨后,在今年1 月的北美CES大會(huì)上,百度推出了由度秘團(tuán)隊(duì)研發(fā)的對(duì)話式人工智能系統(tǒng)DuerOS。而在7月5日的百度AI開發(fā)者大會(huì)上,陸奇公開談到,DuerOS(對(duì)話式人工智能系統(tǒng))和Apollo(自動(dòng)駕駛汽車業(yè)務(wù))可能成為百度未來骨干業(yè)務(wù)。陸奇對(duì)于語音交互的認(rèn)知是一以貫之的,這也體現(xiàn)在他在微軟、百度的業(yè)務(wù)落地之中。
今天在朋友圈看到這樣一句話,有人問:智能家居的中心到底是什么?是手機(jī)、智能音箱還是智能電視?當(dāng)時(shí)很想評(píng)論一句——智能家居的中心就是沒有中心,物聯(lián)網(wǎng)的中心也是沒有中心。
當(dāng)語音識(shí)別無處不在,手機(jī)、電視、遙控器、音箱、垃圾桶,隨便一個(gè)離你最近、能夠識(shí)別語音且能反饋服務(wù)的產(chǎn)品都是智能語音的節(jié)點(diǎn)。
如果非要找到一個(gè)中心,那就是你自己的語音。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。