談到智能語音,早已不是什么新鮮的事情,國外有蘋果Siri,微軟小娜,Google Assistant,亞馬遜的Alexa這樣的智能語音大咖。國內(nèi)有靈犀助手(科大訊飛),小度(百度),小愛同學(小米)這樣的后來跟進者。
首次接觸智能語音的用戶,會覺得很神奇,覺得這東西怎么可以如此智能。而對于經(jīng)常使用的老用戶來說,智能語音助手的雞肋日益顯現(xiàn),因為現(xiàn)階段的智能語音基本都是采用數(shù)據(jù)庫匹配的原則,對于云端數(shù)據(jù)庫中沒有的知識,智能語音也只能“呵呵”了。想必大家都還記得,雷軍同志在2019年的發(fā)布會上,演示小愛智能音箱時出現(xiàn)的多次“車禍”現(xiàn)場。不難看出的是,智能語音設備的拾音技術依然收外界許多因素干擾,進步和優(yōu)化空間巨大。但,對于技術來說,我們應該永遠懷著寬容和理解的態(tài)度去對待,因為任何一門技術都是一個不斷積累和迭代的過程。
對于大部分人來說,目前接觸體驗最多的智能語音硬件應該只有智能音箱和智能機器人。只有通過智能硬件與云端數(shù)據(jù)中心的默契配合,才有可能讓智能語音交互形成完整通路。語音交互的大致流程可分為:聲音采集—>降噪—>語音喚醒—>語音轉文字—>語義理解—>回復文字和指令—>文字轉聲音—>播放聲音。以下天貓精靈智能音箱為例,將語音交互完整步驟做逐步分解。
1.用戶說“天貓精靈,今天天氣怎么樣?”;2、“天貓精靈”被語音喚醒模塊接收到,并判斷為喚醒詞,然后通過AI芯片和硬件拾取和記錄“今天天氣怎么樣”這段語音,并發(fā)送給云端服務器;3、服務器把收集到的電腦信號,再次轉化成文字“今天天氣怎么樣”,交給語義理解服務器;語義理解服務器把“今天天氣怎么樣”這段文字,拆解成“事件=查詢天氣,時間=今天”這段控制指令回傳給設備。4、設備根據(jù)時間和本機地理位置,找天氣服務器查詢天氣,并獲得天氣的的文本數(shù)據(jù)“今天要下雨”;5、設備把“今天要下雨”這幾個字發(fā)給文字轉聲音的服務器,服務器返回“今天要下雨”這段聲音,由設備喇叭播放出來。
毋庸置疑的是,以上五個步驟都是由智能音箱的硬件和云端的數(shù)據(jù)中心配合完成的,硬件只要負責聲音的拾取和傳達,云端則用豐富的數(shù)據(jù)資源去匹配用戶的需求,二者缺一不可。相對來說,聲音前處理技術則是智能硬件最最重要的部分,主要體現(xiàn)降噪和拾音效果兩方面,喚醒以及與機器對話的時候都需要拾音,而且拾音還有近距離和遠距離之說,如果連最基本的聲音都沒有聽清和聽懂,談何后面的數(shù)據(jù)傳達和解析呢。
聲音的前處理技術,是聲音沒有進入傳輸、沒有存儲之前的處理。聲音前處理目的,就是讓聲音的存儲、傳輸效率更高,識別率更好(例如回聲消除、降噪、聲音活動檢測等等)。聲音的后處理技術,是聲音經(jīng)過存儲之后進行播放的同時處理。是對音源例如 MP3 等媒體解碼播放的聲音進音效增強處理(例如虛擬重低音、環(huán)繞立體聲、高音增強、EQ 等等)。如何將人的聲音有效傳達至機器,讓機器“聽到”、“聽清”且“聽懂”? “聽懂”之后又改如何與云端的數(shù)據(jù)進行精準匹配,最終反饋給用戶真正想要的需求動作?這將是智能語音聲音前處理技術和聲音后處理技術應該思考和努力解決的問題。國內(nèi)耕耘聲音20余年,在聲音前處理技術方面已經(jīng)處于領先地位的國產(chǎn)芯片原廠炬芯科技從2018年開始就在核心主推的雙麥克風陣列智能語音芯片,已經(jīng)在各大品牌智能音箱、早教機器人、繪本機器人、物聯(lián)網(wǎng)中控等產(chǎn)品上完美落地,強大的聲音前處理技術為完美智能語音體驗保駕護航。后續(xù)將推出更高端的ATS3609D等高端語音及視頻交互解決方案,對聲音的耕耘炬芯將永無止境。
目前,國家正在加快人工智能的產(chǎn)業(yè)布局,發(fā)布多項利好政策促進人工智能產(chǎn)業(yè)發(fā)展;5G時代的來臨更是為人工智能的發(fā)展培育了一片物聯(lián)網(wǎng)沃土。我們可以預見,智能語音作為下一代人機交互的新入口,將率先在這片人工智能的沃土上生根發(fā)力,推動整個產(chǎn)業(yè)的茁壯成長。如想讓讓智能語音產(chǎn)品做到真正的聰明,智能硬件(包括主控芯片和各種IC)和語音助手(云端數(shù)據(jù)中心)都需要再升級,不斷打通人和機器之間對話的技術壁壘,讓人與機器中間的溝通變成真正的“面對面”溝通。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 螞蟻集團架構大調整:CTO線變革引領技術新潮流
- 蔚來智能駕駛重大調整:組織架構重組,從"半成品"到"端到端"解決方案革新
- 滴滴致歉“臭車”事件,日產(chǎn)本田合并談判引關注,新車市波瀾再起
- 三星助力國內(nèi)手機廠商爭奪高端市場,競爭升級,誰將脫穎而出?
- 美團騎手過度疲勞工作?強制下線跑單超時者,保障騎手健康與安全
- 王自如離職風波揭開真相:董明珠批緋聞無聊,職場風波需理性對待
- 2024車市冷靜觀察:十大熱門車型背后的真實故事
- 中國云服務市場風起云涌:阿里云、華為云、騰訊云三強爭霸,市場份額七成誰主沉浮
- 微信小店“送禮物”功能全面推進:騰訊回應:逐步灰度測試中,小心謹慎不冒進
- 雷諾集團權衡日產(chǎn)與本田合并:利益最大化需謹慎抉擇
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。