10月15日,“包容與多樣”無障礙發(fā)展國際學(xué)術(shù)大會在清華大學(xué)成功舉辦。會議現(xiàn)場,捷通華聲“靈云智會”語音轉(zhuǎn)寫系統(tǒng)將演講者話語進(jìn)行實(shí)時(shí)轉(zhuǎn)寫、實(shí)時(shí)上屏,轉(zhuǎn)寫準(zhǔn)確率高、斷句準(zhǔn)確,受到現(xiàn)場各國研究學(xué)者、清華師生及各界人士的高度好評。
關(guān)于語音轉(zhuǎn)寫效果,現(xiàn)場一名清華學(xué)生說道:這個(gè)語音識別出字快、識別率高,斷句、標(biāo)點(diǎn)也很準(zhǔn)確,不但方便了我們理解學(xué)術(shù)報(bào)告的內(nèi)容和整體邏輯,更是讓現(xiàn)場的聽障人士能直接用眼睛來“聽”學(xué)術(shù)報(bào)告。
“靈云智會”語音轉(zhuǎn)寫系統(tǒng)是什么,在現(xiàn)場是怎樣實(shí)現(xiàn)語音轉(zhuǎn)寫實(shí)時(shí)上屏的?捷通華聲現(xiàn)場工程師介紹說:靈云智會系統(tǒng),是以靈云語音識別為核心,具備實(shí)時(shí)語音轉(zhuǎn)寫、實(shí)時(shí)內(nèi)容校核、實(shí)時(shí)文字上屏功能的智能語音轉(zhuǎn)寫系統(tǒng),不僅可以應(yīng)用在各種大型會議上,也能夠廣泛應(yīng)用于各種辦公會議,幫助完成會議記錄。
關(guān)于現(xiàn)場實(shí)時(shí)語音識別的整體流程,捷通華聲工程師介紹說,首先,演講者的聲音經(jīng)過麥克風(fēng)采集,傳輸至聲控臺,聲控臺將聲音送至PC上的靈云智會系統(tǒng);然后,靈云智會系統(tǒng)應(yīng)用現(xiàn)場服務(wù)器上的靈云語音識別能力平臺,將語音轉(zhuǎn)寫為文字,實(shí)時(shí)反饋至靈云智會系統(tǒng);最后,應(yīng)用靈云智會系統(tǒng)的上屏展示功能,把文字投到現(xiàn)場的兩塊大屏上。
此次大會上,靈云智會系統(tǒng)與人工同傳完美結(jié)合,實(shí)現(xiàn)演講內(nèi)容英中、日中等的同聲傳譯與實(shí)時(shí)上屏。通過靈云智會系統(tǒng)的輔助,一方面,減輕了同傳人員的工作強(qiáng)度;另一方面,提升了同傳效率,讓參會人員能更快、更及時(shí)地聽到翻譯的內(nèi)容。
靈云科技 源自清華 造頂尖語音技術(shù)
此次大會上,靈云智會系統(tǒng)應(yīng)用的是捷通華聲最新一代靈云語音識別技術(shù)(ASR):在CTC算法的基礎(chǔ)上,對建模單元粗粒度、模型訓(xùn)練方法、解碼幀率進(jìn)行創(chuàng)新優(yōu)化,有效提升了語音識別引擎的執(zhí)行效率、魯棒性,增強(qiáng)了對不同口音、語速的適配能力,大幅提升了多人對講、遠(yuǎn)場講話等場景中的語音識別率。
目前,靈云語音識別技術(shù)已支持中文普通話、英語、粵語、維吾爾語、哈薩克語、藏語安多、藏語康巴、朝鮮語、蒙文、廣東陽江話等多種語言識別,并針對金融、電信、公檢法、會議、醫(yī)療等領(lǐng)域訓(xùn)練了專用ASR模型,為行業(yè)客戶提供識別率更高的ASR能力。
捷通華聲董事長張連毅表示,靈云語音識別技術(shù)的重大提升,離不開與清華大學(xué)“靈云科技 源自清華”的戰(zhàn)略合作。2013年,清華產(chǎn)業(yè)基金投資捷通華聲,共同創(chuàng)建“清華靈云人工智能研究中心”。2018年,捷通華聲與清華海峽研究院共建清華海峽研究院靈云人工智能研究中心,張鈸院士親自掛帥,出任研究中心首席科學(xué)家。本次清華國際學(xué)術(shù)會議實(shí)時(shí)語音轉(zhuǎn)寫的成功,是對清華大學(xué)與捷通華聲科研團(tuán)隊(duì)科研成果的一次完美展現(xiàn),也是捷通華聲向清華大學(xué)的一次合作成果匯報(bào)。
靈云智會:語音轉(zhuǎn)錄利器
靈云智會系統(tǒng)是捷通華聲在政府會議、公檢法審訊辦案、醫(yī)療電子病歷等場景應(yīng)用中打磨出來的智能語音轉(zhuǎn)錄系統(tǒng),包含豐富的功能:
語音實(shí)時(shí)轉(zhuǎn)寫:開會過程中,發(fā)言實(shí)時(shí)轉(zhuǎn)寫,并可在編輯框內(nèi)實(shí)時(shí)校正修改,實(shí)現(xiàn)會議內(nèi)容實(shí)時(shí)上屏與分角色記錄;
離線錄音轉(zhuǎn)寫:政府領(lǐng)導(dǎo)外出講話、司法外出辦案問訊、記者采訪等場景的錄音,可直接在靈云智會系統(tǒng)中轉(zhuǎn)寫為文檔;
語音輸入:安裝在PC上,讓用戶可以直接通過麥克風(fēng),進(jìn)行文字輸入,提高辦公效率。
為了進(jìn)一步提升識別率,在行業(yè)客戶應(yīng)用中,捷通華聲會為客戶提供聲學(xué)模型、語言模型定制訓(xùn)練服務(wù),快速實(shí)現(xiàn)對行業(yè)術(shù)語、場景環(huán)境噪音的優(yōu)化,為企業(yè)提供專屬、私有化的語音識別能力。
靈云智會系統(tǒng)已廣泛服務(wù)于大會會議、政府辦公會議、公檢法庭審與辦案、醫(yī)療病歷錄入等場景,給辦公帶來了巨大便利。正如捷通華聲首席科學(xué)家呂士楠先生說的,AI技術(shù)不是陽春白雪,要實(shí)實(shí)在在服務(wù)國家建設(shè)和老百姓生活。捷通華聲董事長張連毅也表示:我們AI公司要腳踏實(shí)地,不斷提升算法能力、深入行業(yè)了解需求,開發(fā)能夠“落地應(yīng)用”的產(chǎn)品與方案,為行業(yè)合作伙伴與市場提供更優(yōu)質(zhì)的AI技術(shù)與產(chǎn)品。
- 特斯拉Model Y新版預(yù)售,iPhone 18 Pro系列升級,汽車界與科技界碰撞新火花
- 小鵬汽車何小鵬回應(yīng)特斯拉 Model Y 撞臉風(fēng)波:設(shè)計(jì)碰撞,靈感碰撞,究竟誰更勝一籌?
- 日本車商2024年新車銷量下滑,本田跌至近10年最低位,中國市場面臨挑戰(zhàn)?
- 英偉達(dá)批評美政府AI芯片出口限制:限制不利己,全球轉(zhuǎn)向替代技術(shù)之風(fēng)
- 特斯拉煥新Model Y難敵華為問界R7,智能科技誰領(lǐng)風(fēng)騷?
- 開源巨頭聯(lián)手打造Chromium聯(lián)盟,推動Linux生態(tài)創(chuàng)新發(fā)展
- 曹德旺巨資辦校,福耀科技大學(xué)引領(lǐng)行業(yè)新風(fēng)向,培養(yǎng)未來之星
- 愛馳汽車陷股權(quán)凍結(jié)風(fēng)波,能否順利復(fù)工復(fù)產(chǎn)引關(guān)注
- 小鵬汽車CEO何小鵬:雷軍不僅直言不諱,還勸我多做營銷,不失為良師益友
- 馬斯克大膽計(jì)劃:未來十年內(nèi)特斯拉機(jī)器人產(chǎn)能提升10倍,300億機(jī)器人將顛覆各行各業(yè)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。