原標(biāo)題:重陽節(jié)推關(guān)愛阿爾茲海默癥項(xiàng)目,搜狗這輪操作要顛覆語音市場格局
在各個(gè)企業(yè)都大步奔向AI技術(shù)時(shí),我們也能發(fā)現(xiàn)越來越多的企業(yè)開始關(guān)注技術(shù)與人文之間的聯(lián)系。就像搜狗重陽節(jié)推出的“以聲相伴”項(xiàng)目,就是以個(gè)性化語音合成為切入,讓廣大用戶嘗試?yán)米约旱穆曇艉铣烧Z音,為阿爾茲海默癥患者讀書,喚起社會(huì)對于患者的關(guān)愛。
除去項(xiàng)目中體現(xiàn)出的人文關(guān)懷和公益精神以外,我們關(guān)注更多的是搜狗在小程序和短片展示的語音合成技術(shù)高度和結(jié)合語音識別的應(yīng)用創(chuàng)新性,在當(dāng)今語音市場群雄爭霸的格局下,搜狗可謂別樹一幟地亮了次肌肉,吸引了行業(yè)的關(guān)注。
被埋藏的寶藏:當(dāng)語音合成成為整個(gè)市場的短板
如果說語音合成是一項(xiàng)不被重視的技術(shù),顯然是不夠客觀的。如今BAT科技巨頭、AI獨(dú)角獸等紛紛入局,語音市場一片熱鬧,很難說有哪一項(xiàng)細(xì)節(jié)技術(shù)是沒有人關(guān)注的。
但從當(dāng)前幾家典型AI技術(shù)企業(yè)的在語音方面的布局來看,的確很少有哪一家展示出了在語音合成方面較為深入的能力。
以百度為例,百度的DuerOS更加注重的是技術(shù)生態(tài)的打造。通過連接硬件,打通百度語音技術(shù)下達(dá)到現(xiàn)實(shí)應(yīng)用場景的通路。因此,顯然DuerOS更注重語音技術(shù)API接口的耦合與整合,包括百度對于AI技術(shù)的整體化關(guān)注,DuerOS技術(shù)體系中也融合了一部分結(jié)合了視覺等等方面的多模態(tài)識別。
另一種典型是科大訊飛等專注于單項(xiàng)語音技術(shù)研究的技術(shù)型企業(yè)。因此對于主攻B端市場的AI技術(shù)企業(yè)來說,語音合成技術(shù)的打造更傾向于“一招鮮吃遍天”,比如大家很熟悉的林志玲語音,就是邀請林志玲前來錄制了四千多個(gè)字,才能搭建成今天聲音和語氣都高度相似的林志玲語音合成。但這種高成本高投入的技術(shù),顯然只能適用于B端市場,不具有普遍性。
裂隙是光透進(jìn)來的地方:搜狗將如何利用技術(shù)撬動(dòng)語音市場格局?
而搜狗在宣傳片中展示出了自己在業(yè)內(nèi)推出的個(gè)性化生成語音和情感遷移兩項(xiàng)技術(shù)。
通過利用聲音數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),從聲音樣本中抓取音色、音調(diào)這樣的關(guān)鍵特征,再把音節(jié)數(shù)據(jù)還原成聲音,就可以在短時(shí)間內(nèi)復(fù)制一個(gè)人的語氣和聲調(diào)。像很多地圖產(chǎn)品推出的明星版語音包,其實(shí)是找了明星錄入上千個(gè)字的讀音加上幾十句短語,拼接起來才能實(shí)現(xiàn)。但搜狗的個(gè)性化生成技術(shù),只需要用戶上傳少量音頻,即可合成高質(zhì)量的個(gè)性化音色。
而情感遷移技術(shù)則是將相聲貫口、唱歌、繞口令等等不同的說話風(fēng)格抽象化,將語速、停頓方式、語調(diào)等特征構(gòu)成神經(jīng)網(wǎng)絡(luò)模型,再對文本信息進(jìn)行處理,進(jìn)而可以模仿各種發(fā)音風(fēng)格。如同視頻中老奶奶的聲音一樣,老年人說話特有的慢條斯理和和藹,都是通過情感遷移才能實(shí)現(xiàn),而不能僅僅依靠音色。
首先,市場中呈現(xiàn)出了敏捷開發(fā)與敏捷應(yīng)用之間的空隙。打造平臺化生態(tài)的技術(shù)企業(yè),關(guān)注的更多是如何幫助開發(fā)者進(jìn)行敏捷開發(fā),讓語音技術(shù)能力可以快速進(jìn)入智能音箱、IOT設(shè)備、汽車等等硬件場景。但作為C端用戶和消費(fèi)者,同樣需要敏捷的應(yīng)用語音技術(shù)。就像宣傳片中體現(xiàn)的,只需幾十秒的對話就能完美復(fù)制一個(gè)人的聲音和語氣,對于用戶來說是一種十分實(shí)用的應(yīng)用方式。例如用戶可以用自己的聲音替換有聲書聲音、用家人朋友的聲音進(jìn)行地圖導(dǎo)航等等。這種敏捷應(yīng)用的廣闊市場是無法被平臺中的開發(fā)者所代勞的,也就為搜狗提供了更加貼近用戶的途徑。
其次,市場中呈現(xiàn)了B端到C端語音商業(yè)化的空白。AI獨(dú)角獸們雖然每一輪融資都數(shù)額巨大,但這也證明專項(xiàng)投入于AI技術(shù)會(huì)造成巨大的變現(xiàn)壓力。而企業(yè)通常會(huì)選擇將這種壓力釋放于B端市場,在同傳、語音客服等等業(yè)務(wù)中收費(fèi)。至于面對C端用戶的服務(wù),又往往是免費(fèi)的。但搜狗在短片中展示出的個(gè)性化語音合成,以及伴隨語音識別交互可以實(shí)現(xiàn)的陪伴,展現(xiàn)出了一種定制化的C端商業(yè)場景。未來用戶或許可以通過付費(fèi)打造一套擁有自己聲音的兒童陪伴語音系統(tǒng),幫助遠(yuǎn)離家鄉(xiāng)的父母陪伴孩子,或是學(xué)??梢詾榻處熀铣梢惶渍Z音家教系統(tǒng),讓學(xué)生熟悉的聲音在課后仍然可以為他們解答問題。搜狗用強(qiáng)大的語音識別能力,結(jié)合起個(gè)性化生成語音和情感遷移兩項(xiàng)獨(dú)特的差異化技術(shù),讓搜狗可以觸及到他人難以抵達(dá)的語音商業(yè)市場。
通往未知的任意門:語音市場的下一章如何書寫?
在今年7月的“Blizzard Challenge 2018 ”語音合成大賽上,第一次參賽的搜狗戰(zhàn)勝了大量國際頂尖科研機(jī)構(gòu),獲得了可懂度和語音停頓兩項(xiàng)任務(wù)中排名第一的優(yōu)異成績。在這樣權(quán)威性極強(qiáng)的國際賽事中獲得這樣的成績,也進(jìn)一步證明了搜狗在語音合成上的能力。不僅是語音合成,搜狗在機(jī)器翻譯上的高度投入,同樣也涉及語音識別,像搜狗旅行翻譯寶這類產(chǎn)品的熱銷和高度啟用率,也給搜狗累積了大量的語音交互書。在WMT2017國際機(jī)器翻譯大賽上,搜狗在語音識別上的準(zhǔn)確率達(dá)到了驚人的97%。
如今搜狗展示出的不光是語音交互和語音合成的技術(shù)能力,更多的則是體現(xiàn)出搜狗進(jìn)一步深入語音市場時(shí),獨(dú)有的技術(shù)優(yōu)勢和商業(yè)化前景。C端個(gè)性化語音合成與交互,可以說是當(dāng)今語音市場的無人之地。搜狗所擁有的優(yōu)勢是技術(shù)上不可替代性,幫助搜狗從一種競品中脫穎而出,有如高塔一般,展示出更多差異化優(yōu)勢也能輻射更多發(fā)展可能。
現(xiàn)如今的語音市場,已經(jīng)基本完成了最初的市場培養(yǎng),越來越多的企業(yè)開始應(yīng)用起智能客服,越來越多的用戶開始習(xí)慣和手機(jī)、音箱對話。正是在這樣市場格局之下,才是比拼差異化、比拼細(xì)節(jié)的關(guān)鍵時(shí)刻。用戶剛剛學(xué)會(huì)了接納,接下來即將學(xué)會(huì)分辨優(yōu)劣并進(jìn)行選擇。搜狗這時(shí)發(fā)揮出了多年的技術(shù)累積,打出了場景應(yīng)用創(chuàng)新與差異化大旗。搜狗此舉是否會(huì)刺激市場更多的向打造差異化優(yōu)勢發(fā)展?或者破壞當(dāng)下微妙的平衡,吸引來大量用戶?通往未知的任意門已經(jīng)打開,一切可能都在醞釀之中,搜狗與語音市場的故事,值得期待。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。