語音識別作為人工智能發(fā)展最早、且率先商業(yè)化的技術(shù),近幾年來隨著深度學(xué)習(xí)技術(shù)的突破,識別準(zhǔn)確率大幅提升,帶動了一波產(chǎn)業(yè)熱潮。繼科大訊飛、捷通華聲之后,行業(yè)內(nèi)又涌現(xiàn)出思必馳、云知聲、出門問問、炬芯科技等后起之秀,在教育、客服、電信等傳統(tǒng)行業(yè)之外,開辟出了車載、家居、醫(yī)療、智能硬件等語音技術(shù)應(yīng)用新天地。與此同時,自然語言處理(NLP)作為人機交互技術(shù)的重要一環(huán),也為此提供了助力。Siri的推出打開了語音交互的先河,不僅催生了一批語音語義創(chuàng)業(yè)公司,還激發(fā)了百度、搜狗等大型互聯(lián)網(wǎng)公司在語音語義技術(shù)上的投入。
在AI快速發(fā)展的時代,語音識別技術(shù)已經(jīng)陸續(xù)出現(xiàn)在生活日常電子產(chǎn)品中,如何智能芯片讓機器聽到且聽準(zhǔn)確人類的語言這將是一大難題。眾所周知,生物識別靠人臉或指紋這類的技術(shù)都有穩(wěn)定的特征,可是聲紋就不穩(wěn)定。一個淺顯的比喻:人高興的時候,第一天晚上唱了卡拉OK,第二天聲音啞了,怎么能夠在變化比較明顯的生物特征上做識別是一個很大的挑戰(zhàn)。語音識別整個過程包含語音信號處理、靜音切除、聲學(xué)特征提取、模式匹配等多個環(huán)節(jié)。由于語音信號的多樣性和復(fù)雜性,系統(tǒng)只能在一定限制條件下才能獲得滿意效果。在真實使用場景中,考慮到遠場、方言、噪音、斷句等問題,準(zhǔn)確率會大打折扣。目前業(yè)內(nèi)普遍宣稱的97%識別準(zhǔn)確率,更多的是人工測評結(jié)果,只在安靜室內(nèi)的進場識別中才能實現(xiàn)。
行業(yè)專家表示:想要讓語音識別更加準(zhǔn)確,需要解決兩方面的問題。一方面,在語音增強、麥克風(fēng)陣列以及說話人分離等多項技術(shù)領(lǐng)域持續(xù)投入,并結(jié)合后端語義,促進對上下文的理解,從而提升識別效果;另一方面,需要從產(chǎn)品設(shè)計上進行優(yōu)化,比如通過進一步交互,使語音識別變得更為準(zhǔn)確。在端側(cè)主控芯片上來講,應(yīng)該研發(fā)出更高端的主控芯片,在聲音前處理方面有更加優(yōu)秀的表現(xiàn),讓拾音的距離和效率都能大幅提升。國內(nèi)AI芯片主力供應(yīng)商炬芯科技作為領(lǐng)先的聲音前處理技術(shù)代表,憑借其20余年對聲音研究的經(jīng)驗,曾推出的智能音頻和智能機器人芯片備受國內(nèi)外知名品牌商的青睞,且一直堅持對聲音領(lǐng)域的不斷投入和研究,堅持通過技術(shù)更好地捕捉聲音,降低干擾,讓有效的聲音信息傳送至智能機器的“耳朵”。
ATS3605(D)就是炬芯近兩年一直在主推的智能語音平臺,此芯片的語音前處理算法非常強大,尤其在降噪方面有非常好的表現(xiàn)。ATS3605(D)在相關(guān)平臺上整合了語音前處理算法、本地語音識別、喚醒、VAD等終端語音的核心算法,對接阿里/Baidu后臺,支持LCD顯示,支持?jǐn)z像頭,并提供完整的智能語音解決方案。目前應(yīng)用到的領(lǐng)域包括智能兒童機器人,智能音箱,智能家居中控等產(chǎn)品上,行業(yè)口碑甚佳。
通過深耕垂直領(lǐng)域和細分賽道,實現(xiàn)自我造血和快速成長,任何一家公司有機會在這一新興產(chǎn)業(yè)中逐漸做大。接下來,隨著語音識別和NLP技術(shù)的逐步成熟,智能汽車、智能家居、智能機器人產(chǎn)業(yè)的日漸完善,定會有一批優(yōu)秀的技術(shù)類公司在智能語音產(chǎn)業(yè)的浪潮中順勢而起。
- 小米召回SU7標(biāo)準(zhǔn)版車型,春運低價票來襲,12306客服回應(yīng),你怎么看?
- 智譜管理層變動引關(guān)注:兩名高管離職,公司未來走向成謎
- 特斯拉召回超120萬輛汽車:安全隱患不容忽視
- 小米召回SU7標(biāo)準(zhǔn)版車型:OTA升級解決,這次為何小米首度召回?
- Anthropic推出全新API:AI信息驗證之戰(zhàn)再掀波瀾
- 未來解碼:英偉達引領(lǐng)機器人技術(shù)產(chǎn)業(yè)融合,智造新篇章
- 網(wǎng)易云下架SM娛樂版權(quán)歌曲:數(shù)百萬用戶將受影響,版權(quán)之爭再起波瀾
- 百川智能全新模型Baichuan-M1:顛覆醫(yī)療循證模式,三大推理能力引領(lǐng)全場景深度思考
- 武漢阿里巴巴總部即將亮相,共繪數(shù)字產(chǎn)業(yè)新藍圖
- iPhone 16在禁令后苦盡甘來:蘋果即將與印尼達成協(xié)議,解禁在望
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。