精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<blockquote id="19tge"><meter id="19tge"></meter></blockquote>

<blockquote id="19tge"><strong id="19tge"></strong></blockquote>

<thead id="19tge"><legend id="19tge"><fieldset id="19tge"></fieldset></legend></thead>

^{<strike id="19tge"></strike>}

<delect id="19tge"></delect>

<strike id="19tge"><center id="19tge"><em id="19tge"></em></center></strike>

首頁
熱搜
人物
明星
媒體
友推
快訊

供應商
小紅書
回首頁

資訊
極客熱點
企業(yè)動態(tài)
友推福利
友媒專區(qū)

軟件
PC軟件
移動APP
操作系統(tǒng)
工業(yè)軟件

酷玩
手機數(shù)碼
明星腕表
極客游戲
智能汽車
時尚輕奢

創(chuàng)業(yè)
創(chuàng)業(yè)頭條
創(chuàng)業(yè)學院
項目招商
工作機會
兼職副業(yè)

極客網(wǎng) > 每日熱讀 >

郭德綱out了，聽自己的語音導航吧

人閱讀
2019-09-19 23:34:27
相關關鍵詞

文|吳俊宇

美國鬼才科普作家詹姆斯·弗拉霍斯用《智能語音時代》這樣一個標題形容了如今語音科技對人們的影響。

他的副標題很有趣——商業(yè)競爭、技術創(chuàng)新與虛擬永生。

在他看來，每十年左右，人與技術的互動方式就會有一個根本性的轉(zhuǎn)變。數(shù)十億美元的財富會“恭候”那些定義了新的時代范式的公司，而落伍者將破產(chǎn)倒閉。

語音正在變成影響現(xiàn)實的通用遙控器，成為幾乎能控制任何一種技術裝置的手段。語音打破了世界上一些最有價值的公司的商業(yè)模式，為新的應用創(chuàng)造了機會。

這一次，百度地圖用語音定制功能同時展現(xiàn)了品牌營銷和技術積淀的雙重能力。其中的語音技術未來的ToB、ToC領域也都有寬闊的運用空間。

一

品牌營銷的創(chuàng)新

過去地圖行業(yè)常常找來明星站臺，通過明星語音包的方式展開品牌活動。

這種策略的確卓有成效，事實上，不管是湯唯、林志玲語音都很受用戶的歡迎。但是要知道，明星的粉絲畢竟圈層有限，明星語音可能僅僅只能吸引一部分粉絲用戶，想要真正擴大圈層，實現(xiàn)營銷破圈，可能要采取一些別的策略。

不過有趣的是，9月19日，百度地圖發(fā)布語音定制功能，直接推出了用戶定制專屬語音包。

定制方式很簡單，打開百度地圖App，喚醒“小度小度”后說“錄制我的語音”，或點擊百度地圖首頁的“出行助手”后進入“語音定制”，便可開啟語音定制之旅。在安靜的環(huán)境中，跟著百度地圖指引，念出卡通和影視臺詞等充滿趣味性的錄制文本，等待大約20分鐘，就能擁有一個自己專屬的語音包。

百度地圖事業(yè)部總經(jīng)理李瑩

最后你就可以用自己的語音包替換掉其他明星語音包，可以在百度地圖的景區(qū)智能語音導覽、智能語音交互、導航等全部場景使用。

讓用戶使用地圖時聽著自己的語音，這或許是一個對所有人來說，都是個饒有趣味的嘗試，這種嘗試的有趣之處在于：

1、滿足新鮮感；明星語音已經(jīng)是市面上大部分手機地圖的常規(guī)操作，由于傳導機制的不同，人們聽自己聲音與自己聲音的錄音往往不同，這種“奇妙而羞恥”的感受往往比明星語音來得更有趣。

2、打破了圈層；明星語音畢竟只是一部分粉絲群體會選擇使用，但是自己的語音卻是所有人都感興趣的，不花一分錢請明星做代言，不針對少部分粉絲用戶群體，直接用技術手段覆蓋所有用戶群體，這種策略可謂是四兩撥千斤。

可以說，這既是一次營銷活動，也是一次技術展示。而且兩者有著很好的結(jié)合，

已經(jīng)很少有品牌營銷能夠真正讓技術能力得到釋放，但是百度地圖這次做到了。它讓技術和營銷軟硬兼?zhèn)洹?/p>

二

語音技術的躍進

這個功能主要應用了百度獨創(chuàng)的風格遷移技術Meitron模型。

所謂風格遷移這個概念最早來源于圖像領域的概念，簡單說就是：將一張圖片的藝術風格應用到另外一張圖片上。

語音的風格遷移其實也被稱作是“語音克隆”(voice clone)、“多說話人風格遷移”(multi-speaker)、“風格遷移”(style transfer)、“語音轉(zhuǎn)換”(voice conversion)。

要知道語音的風格遷移非常困難。

因為深度網(wǎng)絡對于語音處理困難。一來不如圖像和文本領域研究火熱，二來語音所具有的信息，難以編碼到高維隱空間。一段語音時間序列中，混雜著以下方面的信息：說話人特征(如一個人的音色，音調(diào)等)；語言學內(nèi)容(語音表述的內(nèi)容)；副語言特征(如情感等)。

2017年，美國曾有一篇名為《Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-to-End Speech Synthesis》的學術論文講述風格遷移的問題。

百度地圖這次采用的Meitron模型其特點主要體現(xiàn)在發(fā)音人音色轉(zhuǎn)換，多情感朗讀和韻律風格遷移三個方面，從而讓個性化語音合成的定制門檻大大降低。

要知道，過去明星地圖語音的錄制非常麻煩。以高德地圖的林志玲語音為例，它的制作分成兩塊。

一塊是按照錄音稿錄制出來的語音內(nèi)容。另一塊則是高德當時找專人，跟了林志玲幾個月，貼身錄音，把原始聲音文件處理提取出數(shù)字特征。再采用通用的、很完善波型合成技術，將元音、輔音及音調(diào)等采樣，通過算法實現(xiàn)文語轉(zhuǎn)換。

這是2014年明星語音生成的處理方案——看完你大概會想，錄個音實在太難了。

但是在Meitron模型下情況就不一樣了，這個模型背后的技術支撐是百度大腦語音技術的賦能。AI的加持讓地圖語音包生產(chǎn)實現(xiàn)了從月級別到分鐘級別的突破性進展。

百度語音首席架構師賈磊

該模型是目前行業(yè)領先的語音合成技術。用手機即可完美復刻說話者的音色，風格，情緒等。

關鍵是，僅僅只需要20分鐘就能全部生成。也就是說，未來不管是什么明星，他們的語音只需要在Meitron模型里跑20分鐘，基本就能生成一個完整的導航語音包。

語音合成能力越強，其實也說明未來人機交互、語義理解的可能性越大，機器閱讀的能力越強。

短短5年時間，AI加持下的語音技術可謂突飛猛進。百度大腦的實力可見一斑。

三

未來商業(yè)的結(jié)合點

這次品牌營銷其實也是百度語音技術的一次能力展示，它未來在ToB側(cè)、ToC側(cè)都可以有更多結(jié)合之處。

比如深度神經(jīng)網(wǎng)絡技術，提供高度擬人、流暢自然的語音合成服務，讓客戶的應用、設備開口說話，更具個性。

1、教育和閱讀類產(chǎn)品：讓課程和講解變得更生動

通過閱讀類APP閱讀小說或新聞時，如果使用語音合成技術為用戶提供多種發(fā)音人的朗讀功能，釋放雙手和雙眼，獲得更極致的閱讀體驗。

2、生活和服務類產(chǎn)品：讓服務交互效率得以提升

語音合成還可應用于打車軟件、餐飲叫號、排隊軟件等場景，通過語音合成進行訂單播報，讓用戶便捷獲得通知信息。面部識別則是可以展開顧客識別、訂單校對。

3、智能硬件類產(chǎn)品：讓人機活動變得更鮮活有趣

可集成到兒童故事機、智能機器人、平板設備等智能硬件設備，使用戶與設備的交互更自然、更親切。

當然，對百度地圖自身而言，這次語音合成技術的使用使其人工智能地圖的稱謂名副其實——所謂人工智能地圖指的是，在AI賦能下，地圖在交互體驗、位置信息、出行服務以及出行決策等方面產(chǎn)生了重大變革。

對ToC用戶來說，未來的百度地圖會具備更多AI能力和語音交互能力，它在使用過程中會變得更便捷、更智能，比如說，結(jié)合用戶的使用習慣和當前的場景，通過用戶畫像、深度學習等能力，給每個用戶帶來個性化信息和服務推薦。

對ToB用戶而言，未來的百度地圖同樣可以運用AI能力和語音交互能力，為客戶和商家基于語音的地理位置服務，結(jié)合人口分布、客流分析、設施分布等多項大數(shù)據(jù)分析服務；面向規(guī)劃、房產(chǎn)、商業(yè)、零售等行業(yè)提供解決方案。

當“你應我答”的模式出現(xiàn)，在人與人之間、人與機器之間，交談就絕不只是一種純粹依靠邏輯展開的過程。語言永遠不是脫離內(nèi)容的外殼，人都會被語言影響或打動。

未來，我們與無處不在的機器構成的世界，將是一個前所未見的更加豐富多彩的感性世界。

詹姆斯· 弗拉霍斯有這樣一個設想：

在云時代，“只要簡單地加上一個麥克風和一個Wi-Fi芯片，任何裝置都能實現(xiàn)語音驅(qū)動。從浴室的水龍頭到孩子玩的布娃娃，任何裝置都能利用分布在全球的幾千臺計算機所提供的計算能力。”這幾乎意味著“萬物能言”的童話世界真的實現(xiàn)了。

在這樣的世界之中，商業(yè)邏輯和產(chǎn)品邏輯也將有著更多改變。語音可能真的要成為地圖等產(chǎn)品的入口之一。

--------------------------------------------

作者 | 吳俊宇 公眾號 | 深幾度

作者系獨立撰稿人，微信號852405518

關注科技公司、互聯(lián)網(wǎng)現(xiàn)象的解讀

曾獲鈦媒體2015、2016、2018年度作者

新浪創(chuàng)事記2018年度十大作者

品途網(wǎng)2016年度十大作者

騰訊科技2015年度最具影響力自媒體

極客網(wǎng)企業(yè)會員

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內(nèi)容或斷開相關鏈接。

下一篇

第四屆“多多農(nóng)研科技大賽”取得多項突破成果拼多多向設施農(nóng)業(yè)要新質(zhì)供給

多多農(nóng)研科技大賽拼多多設施農(nóng)業(yè) 新質(zhì)供給中國農(nóng)業(yè)大學賽博農(nóng)人隊

極客觀察

專題報道

企業(yè)專欄

簡版
原版
投稿
回頂部

2019-09-19

郭德綱out了，聽自己的語音導航吧

文|吳俊宇美國鬼才科普作家詹姆斯·弗拉霍斯用《智能語音時代》這樣一個標題形容了如今語音科技對人們的影響。他的副標題很有趣——商業(yè)競爭、技術創(chuàng)新與虛擬永生。在他看來，每十年左右，人與技術的互動方式就會有一個根本性的轉(zhuǎn)變。

長按掃碼閱讀全文