文|曾響鈴
來源|科技向令說(xiangling0815)
你可能已經(jīng)習(xí)慣了“前方路口左轉(zhuǎn)”這樣的地圖語音由一個(gè)標(biāo)準(zhǔn)的女聲,或者某明星的聲音發(fā)出。
但是,百度地圖最近推出的一個(gè)功能“語音定制”可能要顛覆你的認(rèn)知了:指揮路癡的你怎么走,或者與你進(jìn)行日常交互,或者告訴你景點(diǎn)信息、好吃好玩的聲音,可能是你自己的或者是你想要的某種聲音!
過去幾年,百度地圖陸續(xù)推出以AI為依托的殺手級應(yīng)用功能,例如能夠識別復(fù)雜語音需求的“全語音操控”,用戶只需要隨心所欲用嘴說出自己要去哪、干什么,地圖就能夠自動甄選目的地并導(dǎo)航。
現(xiàn)在,每個(gè)人都可以有屬于自己的地圖定制化語音包,AI再一次讓百度地圖驚艷。而作為行業(yè)觀察者,響鈴和身邊的同事、家人、朋友要以用戶的身份,去看看這個(gè)百度內(nèi)部代號為“百雀靈”的語音定制項(xiàng)目落地后究竟能帶給我們什么樣的體驗(yàn)和感受。
語音定制后,百度地圖這下把“個(gè)性化”玩到了底
由于有了全語音操控能力,在進(jìn)入“語音定制”功能這件事上,百度地圖也充分利用了語音技術(shù)的優(yōu)勢,除了通過手動點(diǎn)擊地圖首頁的“出行助手”后進(jìn)入“語音定制”,我們在打開APP后,只需要喚醒“小度小度”后說出“錄制我的語音”也能進(jìn)入功能界面。
(喊“小度小度”開啟語音包錄制)
語音合成技術(shù)是一套復(fù)雜的技術(shù)體系,這里不多談。僅從我們普通用戶的使用而言,簡單來說,我們能接觸到的主要有三個(gè)階段:提供語音素材、等待后臺合成、最終上手使用,每一個(gè)階段都關(guān)乎體驗(yàn)是否足夠良好。
過去地圖界也有類似的語音合成技術(shù),但由于技術(shù)并不足夠成熟,僅限于商用級別的明星、KOL個(gè)案聲音錄制,畢竟,每一個(gè)聲音都需要花費(fèi)大量時(shí)間到專用的錄音棚采集聲音素材,長時(shí)間的合成運(yùn)算也需要等上很長的時(shí)間(往往以月為單位)。
如果給我們普通用戶的個(gè)性化語音定制也是這么一套流程,定制也就失去了用戶體驗(yàn)的意義。
現(xiàn)在,實(shí)際體驗(yàn)下來,百度地圖的語音定制已經(jīng)解決這個(gè)商用技術(shù)走向“民用”的問題。
先看聲音素材采集階段。
實(shí)測只要找一個(gè)相對安靜的環(huán)境,不管是較少人聲的辦公室還是無人的會議室,跟著百度地圖的指引念出20句不超過15字的素材,采集就能順利完成。這個(gè)過程中,用戶還可以選擇不同的風(fēng)格的引導(dǎo)語句跟讀,例如卡通素材、影視臺詞等。
百度地圖原本讓所有人用一套句子應(yīng)當(dāng)也可以,但它沒有這么做,可見即便素材采集已經(jīng)足夠簡單,用戶體驗(yàn)的細(xì)節(jié)還是不放過。
(公司同事紛紛錄制屬于自己的聲音)
錄制完成后,進(jìn)入等待期。百度地圖官方宣布用戶大約需要等待20分鐘,來進(jìn)行云端的個(gè)性化語音合成。這個(gè)速度相對于過去以月為單位的合成速度,已經(jīng)呈現(xiàn)了幾何級提升。
但是,實(shí)際APP體驗(yàn)時(shí),用戶的等待時(shí)間往往只有15分鐘:
(實(shí)測等待時(shí)間普遍為15分鐘)
15分鐘后,經(jīng)過簡單的設(shè)置,選擇自己的語音包作為APP默認(rèn)語音包,百度地圖各類導(dǎo)航、交互、資訊介紹全部變成用戶自己的聲音,以后甚至借助百度地圖的景區(qū)播報(bào)功能,可以自己當(dāng)自己的導(dǎo)游!
為了當(dāng)場測驗(yàn)語音效果,響鈴設(shè)置了離辦公室不遠(yuǎn)的星巴克作為目的地,駕車由百度地圖進(jìn)行導(dǎo)航,
(個(gè)人導(dǎo)航語音包實(shí)測中)
實(shí)話實(shí)說,最終的個(gè)性化語音包與真人的擬合程度并沒有達(dá)到100%、一模一樣的水平,但直觀上,八到九成的相似度肯定有,隨機(jī)邀請寫字樓的朋友去“喝咖啡”,這位朋友被驚訝到,“怎么會是你的聲音”,沖擊感十分強(qiáng)烈。
這樣的擬合程度,僅從技術(shù)角度看,在簡便的素材采集和極短的合成時(shí)間下已經(jīng)非常高。
總體而言,自己和身邊的百度地圖用戶體驗(yàn)下來,最大的感受是“個(gè)性化”做到了極致。
過去我們老談APP產(chǎn)品的個(gè)性化,但說實(shí)話這種個(gè)性化都是“一群一群”的,地圖APP給我們劃定了一個(gè)個(gè)明星包,大家“選擇”自己喜歡的,個(gè)性化程度比過去的一成不變要好很多。
但是,隨著我們用戶的個(gè)性化需求越來越強(qiáng),這種“聚類”型的個(gè)性化已經(jīng)難以滿足需要。從語音包到語音定制,AI語音合成讓個(gè)性化真正變成字面意義,每一個(gè)人都開始擁有真正屬于自己的“一個(gè)一個(gè)”的個(gè)性化體驗(yàn)和服務(wù)。
你的APP體驗(yàn),只有你才會有,這才是把個(gè)性化玩到了底。
AI+地圖玩到這個(gè)程度,大家終于不再有選擇困難癥了
選擇困難癥是移動互聯(lián)網(wǎng)信息爆炸、產(chǎn)品爆炸、功能爆炸時(shí)代每一個(gè)手機(jī)前的用戶常常犯的毛病,不知道用誰,有時(shí)候這個(gè)APP好,有時(shí)候又覺得那個(gè)產(chǎn)品不錯(cuò),結(jié)果手機(jī)里裝塞滿了各種舍不得卸載又不怎么用的APP,常常報(bào)警提醒我們要清理手機(jī)了。
語音定制功能的推出,是百度地圖AI+地圖玩法的深入,徹底的個(gè)性化后,不講其他行業(yè)大道理,起碼用戶的選擇困難癥可能不會再犯了。
實(shí)際體驗(yàn)下來,理由有三:
1、徹底的個(gè)性化就是用戶粘度的最好來源
用戶之所以會選擇困難,原因無非在于產(chǎn)品或功能的同質(zhì)化,或者即便有差異化的地方,也不足以支撐用戶足夠忠誠于某款產(chǎn)品。
一個(gè)顯而易見的事實(shí)是,不少用戶手機(jī)里往往裝了好幾個(gè)地圖APP,在過去,使用哪個(gè)產(chǎn)是沒有偏好或者說偏好不強(qiáng)的,有時(shí)候用這個(gè)有時(shí)候用那個(gè)。
但是,語音定制可能改變這一狀況。直觀的使用感受就是,當(dāng)語音包的聲音變成自己的聲音時(shí),對APP的心態(tài)會發(fā)生變化,不再糾結(jié)選擇誰,而是自然而然去打開那個(gè)“有只屬于自己聲音”的APP,這并不是獵奇或嘗鮮,而是某種歸屬感所帶動。
我們常常談?wù)摰挠脩粽扯?,不就是需要這樣的與用戶心智上的連接么?
2、外部情感的依從,推動了對APP的使用習(xí)慣
此次百度地圖推出語音定制,不僅僅有成年人錄制聲音的模式,還專門針對童聲發(fā)音不清晰、不流暢等情況進(jìn)行了優(yōu)化,如果我們愿意,可以讓孩子的聲音為日常地圖交互增添色彩。
發(fā)布會現(xiàn)場,百度地圖事業(yè)部總經(jīng)理李瑩表示一上線就給其女兒錄制了專屬語音包,并設(shè)置為默認(rèn)??梢哉f,此時(shí)的李瑩既是百度地圖的主要負(fù)責(zé)人,也可以代表一個(gè)有孩子的普通用戶。
(百度地圖事業(yè)部總經(jīng)理李瑩)
而響鈴的同事黃女士,以普通用戶的身份也第一時(shí)間錄制了其4歲可愛女兒的聲音,并設(shè)置為默認(rèn)語音包,按她的話說,“(對這個(gè)新功能的)第一感覺是感動”。
(黃女士正在引導(dǎo)女兒跟讀語音采集素材句子)
把現(xiàn)代人最重視的孩子納入到產(chǎn)品體驗(yàn)當(dāng)中來,許多APP產(chǎn)品未必想不到,但是,通過AI能力的巧妙應(yīng)用,這種體驗(yàn)就順勢變成了我們用戶的某種情感依從。
不只是孩子,還有現(xiàn)任女朋友、男朋友(如果你想的話,前任也不是不可以)、暗戀的人……地圖APP里有那些你珍視的人的聲音,你還會犯選擇困難癥嗎?
某種程度上,借助AI技術(shù)優(yōu)質(zhì),百度地圖成功把用戶的外部情感依從,轉(zhuǎn)化到了產(chǎn)品內(nèi)部的使用粘性。
3、技術(shù),永遠(yuǎn)讓產(chǎn)品更豐富、更有趣、更能突破舊有限制
實(shí)測隨著此次語音定制一同上線的,還有一套帶有某種社交屬性和內(nèi)容平臺屬性的分享系統(tǒng),我們認(rèn)為雖然官方的宣傳著墨不多,但這套系統(tǒng)更值得玩味。
一方面,我們用戶錄制的個(gè)人語音包可以直接分享給親朋好友,在熟人社交環(huán)境下可以相互分享“聲音”——異地的戀人怕是要感動不已。
另一方面,百度地圖上某些“人氣”的語音包,還有可能獲得官方推薦,成為地圖產(chǎn)品里的“好聲音”,而這已經(jīng)超出地圖產(chǎn)品的范疇,帶有某種內(nèi)容創(chuàng)作式的平臺屬性——雖然百度地圖未必這么想,但從用戶角度看,客觀上就是如此。
一個(gè)聲線優(yōu)美的女生,或者聲音溫暖磁性的男生,某一天或都有了僅通過聲音質(zhì)量創(chuàng)作內(nèi)容、表現(xiàn)自己的可能,或者,也來個(gè)語音包界的“網(wǎng)紅”?
輕互動、輕社交、輕內(nèi)容……相信更多人不會再糾結(jié)日常要使用哪個(gè)地圖APP了。
更好的AI,理應(yīng)讓更多人分享
能夠給到我們普通用戶美好體驗(yàn)的技術(shù),背后一定是經(jīng)過了長久的磨礪。用戶看到的永遠(yuǎn)只是技術(shù)冰山露出來的一角,底下是無數(shù)時(shí)間和實(shí)踐的積累。
語音定制同樣如此,它背后是百度獨(dú)創(chuàng)的“說話人”韻律遷移技術(shù)Meitron,按百度語音首席架構(gòu)師賈磊的說法,能夠?qū)崿F(xiàn)“發(fā)音人音色轉(zhuǎn)換,多情感朗讀和韻律風(fēng)格遷移”,簡而言之,即從各個(gè)方面完全學(xué)習(xí)發(fā)音人說話,做到合成后的語音與真人語音在各個(gè)方向貼近,讓人分不出。
(百度語音首席架構(gòu)師賈磊)
事實(shí)上,早前央視公益節(jié)目《等著我》與百度合作,利用有限的素材合成已經(jīng)過世老排長聲音發(fā)出的句子,讓苦尋他多年的老戰(zhàn)士現(xiàn)場感動落淚,就是Meitron所實(shí)現(xiàn)。
更進(jìn)一步看,Meitron背后還有百度語音方面的一系列體系化AI能力,它作為語音合成的一個(gè)分支,本身也是百度語音的重要技術(shù)成果之一。
從百度AI,到百度語音,到Meitron,到語音定制,一環(huán)扣一環(huán),最終個(gè)性化的語音合成定制門檻大大降低,普通用戶更加直接地觸摸到AI、感知到AI。
我們不必再把AI視為高高在上的存在,它就是我們身邊的技術(shù)。百度地圖的語音定制內(nèi)部代號是“百雀靈”,這樣來看是希望所有用戶都定制出自己的語音包,個(gè)性化語音合成的定制門檻大大降低,每一個(gè)人,都可以做一只擁有專屬聲音的“雀”。
這樣的語音定制可以、也應(yīng)當(dāng)應(yīng)用到更多需要語音交互的產(chǎn)品上,讓那些非地圖場景下的用戶也能有類似的美好體驗(yàn),共同觸摸AI。百度地圖是第一個(gè)帶來美好技術(shù)體驗(yàn)的產(chǎn)品,相信后面還會有更多百度系的產(chǎn)品用上這樣的個(gè)性化語音定制。拭目以待吧。
*此內(nèi)容為【科技向令說】原創(chuàng),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
【完】
曾響鈴
1鈦媒體、品途、人人都是產(chǎn)品經(jīng)理等多家創(chuàng)投、科技網(wǎng)站年度十大作者;
2 虎嘯獎高級評委;
3 作家:【移動互聯(lián)網(wǎng)+ 新常態(tài)下的商業(yè)機(jī)會】等暢銷書作者;
4 《商界》《商界評論》《銷售與市場》等近十家雜志撰稿人;
5 鈦媒體、界面、虎嗅等近80家專欄作者;
6 “腦藝人”(腦力手藝人)概念提出者,現(xiàn)演變?yōu)椤白悦襟w”,成為一個(gè)行業(yè)。
7 現(xiàn)為“今日頭條問答簽約作者”、多家科技智能公司傳播顧問;
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。