自從百度把人工智能當做核心發(fā)展戰(zhàn)略之后,這方面的進展也是神速。
3 月 13 日,百度宣布推出一款名為SwiftScribe的網(wǎng)頁版應用,它能夠利用人工智能技術(shù)把語音文件進行轉(zhuǎn)錄,感興趣的可以去試試看。
長期以來,人們在轉(zhuǎn)錄語音文件時,常常需要通過手動逐字錄入。但是SwiftScribe這款應用通過集成百度自主研發(fā)的語音識別技術(shù)以及功能簡單的編輯工具,可以幫助人們實現(xiàn)語音文件快速、便捷的轉(zhuǎn)錄,提高生產(chǎn)效率。
據(jù)百度介紹,SwiftScribe 依托的核心技術(shù)來自百度的新一代深度語音識別系統(tǒng)—— Deep Speech 2。通過利用長達數(shù)千小時的標注語音數(shù)據(jù)進行“訓練”,Deep Speech 2可以不斷“學習”從語音中識別特定的字或詞。
(圖片來自:Networked India)
此外,百度還通過直覺快捷鍵以及人機交互技術(shù)來解決語音錄入的不連貫問題。
對于那些職業(yè)速錄師來說,SwiftScribe 能成為他們的生產(chǎn)力利器。對于一段時長為一小時的語音文件來說,常規(guī)情況下需要 4-6 小時去進行人工轉(zhuǎn)錄,并且每分鐘的轉(zhuǎn)錄成本約合 1 美元。如果使用 SwiftScribe 的話,所用時間能縮短差不多 40%。
不過,雖然人工智能可以提高生產(chǎn)力,短時間內(nèi)還沒辦法完全取代人類。在 SwiftScribe 完成初步的語音轉(zhuǎn)錄后,還需要人工去檢查大小寫、標點符號、錯別字等等。
據(jù)百度的項目經(jīng)理吳甜介紹,SwiftScribe 目前僅支持一小時以內(nèi)的語音文件轉(zhuǎn)錄,但團隊還在對應用的功能進行進一步開發(fā),以后可能會增加對視頻文件的語音識別、支持更多文件格式以及自動添加標點符號等功能。
從第一代的 Deep Speech 到第二代的 Deep Speech 2,百度已經(jīng)在深度語音識別技術(shù)上深耕多年。2016 年,百度推出了使用 Deep Speech 系統(tǒng)的 TalkType,為 Android 鍵盤添加語音錄入功能。同年,百度的深度語音識別系統(tǒng) Deep Speech 2 還入選了美國《麻省理工評論》的 2016 年十大突破技術(shù)。
(百度 TalkType,圖片來自:VentureBeat)
如今,包括亞馬遜、蘋果、Google 和微軟在內(nèi)的多家互聯(lián)網(wǎng)巨頭都在布局語音識別技術(shù)領(lǐng)域,國內(nèi)的科大訊飛、搜狗等企業(yè)也都在語音識別領(lǐng)域有所建樹。
百度首席科學家吳恩達曾表示:
我認為語音識別技術(shù)已經(jīng)發(fā)展到了非常可靠的程度,使用的時候甚至都不用去想它。最好的科技往往是看不見的,而語音識別正在變得更加可靠,我希望它能夠退居幕后。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 英偉達涉嫌違反反壟斷法 市場監(jiān)管總局依法決定立案調(diào)查
- 上海敲定5G-A發(fā)展目標:到2026年發(fā)展500萬用戶,建設3.2萬個3CC基站
- 中國電信注資10億成立天通衛(wèi)星科技公司,將推動衛(wèi)星通信手機向3000元下探
- 上汽今年銷量或會被比亞迪反超,痛失18年“中國車企銷量冠軍”
- 英特爾CEO基辛格名為退休,實為被董事會趕下臺?
- 華為申請多枚鴻蒙辦公商標,涉及辦公用品等多個領(lǐng)域
- “數(shù)智化”登頂《咬文嚼字》十大流行語,數(shù)智技術(shù)應用深入人心
- IDC預計:2028年AI基礎設施支出將超1000億美元
- 韓系動力電池裝機量下挫,三大廠商市占率降至17.2%,落后寧王比亞迪
- 全球折疊屏手機霸主,Q3份額大跌21%,拖累行業(yè)整體下滑1%
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。