2022年3月16日,由中國人工智能學(xué)會多語種智能信息處理專委會(CAAI-IMLIP)主辦,傳神語聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司承辦的“人工智能在多語信息處理領(lǐng)域的創(chuàng)新探討研討會”,在武漢、北京兩地,以線上+線下結(jié)合的形式聯(lián)動呈現(xiàn)。本次研討會匯聚多位多語信息處理領(lǐng)域的知名專家學(xué)者,共聚一堂,圍繞深度語義解析、多語言語音處理、推薦系統(tǒng)中的信息去噪、機器翻譯技術(shù)等,共探人工智能在多語種信息處理領(lǐng)域的創(chuàng)新和發(fā)展。
物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等新技術(shù)正當(dāng)其時,技術(shù)的變革往往帶來文化的新形態(tài),由此也會對語言文字帶來廣泛而深刻的影響。同時,伴隨“一帶一路”建設(shè)的深入推進,多語種信息處理領(lǐng)域急需進一步整合語種資源、數(shù)據(jù)資源,利用云計算、人工智能、大數(shù)據(jù)等技術(shù)深入開展自然語言理解、智能語音交互、機器翻譯等技術(shù)的研究。
數(shù)字時代發(fā)展,多語信息領(lǐng)域呈全新趨勢
中國人工智能學(xué)會多語種智能信息處理專委會秘書長張華平教授代表專委會在研討會上致辭,強調(diào)專委會成立的初衷,通過成立各個工作組、開展各項主題會議的形式,促進多語種智能處理的發(fā)展,鏈接全球、鏈接產(chǎn)學(xué)研,實現(xiàn)語言相通、信息相通,為“一帶一路”上各國家各民族的經(jīng)貿(mào)相通、文化相通與民心相通貢獻(xiàn)力量。
傳神語聯(lián)此次承辦研討會,也獲得了張華平秘書長的高度贊揚和支持,對此傳神語聯(lián)創(chuàng)始人兼董事長何恩培在發(fā)言中提到,在信息大爆炸時代,面對不同語言背后的信息轉(zhuǎn)化需求,要從兩個維度用AI重塑翻譯作業(yè)流程和供應(yīng)鏈改造,從而達(dá)到機器的速度,人的質(zhì)量。而數(shù)字技術(shù)的介入,意味著新翻譯時代已然到來。
不同語言的轉(zhuǎn)化不只是簡單的信息轉(zhuǎn)換,更多是不同文化的碰撞和呈現(xiàn)。翻譯需要賦予不同語言標(biāo)準(zhǔn)、正確、精美的含義。而語義分析作為處理自然語言時需要執(zhí)行的步驟之一,其核心目的就是將正確的意義分配給句子,讓整句話呈現(xiàn)精準(zhǔn)的含義。
貫穿語義和語音層面,探索創(chuàng)新可能
語義分析作為NLP核心技術(shù)中的一項,一直以來都備受業(yè)內(nèi)人士關(guān)注。北京語言大學(xué)信息學(xué)院院長荀恩東教授在演講中提到,“語義分析的本質(zhì)是生成語義概念結(jié)構(gòu)。通過采用組合策略實現(xiàn)深度語義分析,消解在語義分析過程中遇到的多樣性以及歧義性等問題,從而提升系統(tǒng)的可解釋性。”
人類通過語言鏈接自身和外部世界,語言作為溝通和認(rèn)知的工具,輔助人類不斷探索未知??萍嫉倪M步讓語言有了更多樣、更智能化的呈現(xiàn)模式。在這其中語義分析技術(shù)相當(dāng)于人類大腦,負(fù)責(zé)思考和信息處理,而語音技術(shù)則相當(dāng)于人的嘴巴和耳朵,負(fù)責(zé)表達(dá)和獲取。
圍繞解決低資源語言語音處理問題,新加坡科技研究局董明會博士以語音識別和語音翻譯為例,講解了利用已有的大語種語言數(shù)據(jù)的多語言處理技術(shù)、通過使用無監(jiān)督學(xué)習(xí)的方法、預(yù)訓(xùn)練模型和遷移學(xué)習(xí)的新思路。
技術(shù)賦能創(chuàng)新,信息獲取和轉(zhuǎn)化方式更便捷
數(shù)字技術(shù)的不斷發(fā)展,為互聯(lián)網(wǎng)經(jīng)濟發(fā)展賦予了全新思路。來自武漢大學(xué)國家網(wǎng)絡(luò)安全學(xué)院的李晨亮教授,從序列推薦、購物籃推、新聞推薦以及短視頻推薦四個任務(wù),講述了利用信息去噪改善推薦性能的幾項嘗試。
隨著全球化網(wǎng)絡(luò)時代的到來,人們依托數(shù)據(jù)推薦獲取更精準(zhǔn)的信息,在接受多樣化信息的同時,也面臨著語言障礙問題。實現(xiàn)任意時間、任意地點、任意語言的無障礙自由溝通是人類追求的一個夢想。也是全球化、數(shù)字化背景下的一個行業(yè)縮影。因此技術(shù)的融入,賦予了人們快速跨越語言障礙的方式方法,更便捷更高效的滿足信息轉(zhuǎn)化的需求。
伴隨AI技術(shù)在翻譯行業(yè)逐步深入的應(yīng)用,如何在確保機器翻譯優(yōu)勢的前提下,滿足商用交付質(zhì)量成當(dāng)下亟待解決的問題。傳神語聯(lián)網(wǎng)研究院執(zhí)行院長何征宇在演講中,表明語聯(lián)網(wǎng)自主開發(fā)構(gòu)建IOLAIDrive語聯(lián)網(wǎng)人工智能底層支撐系統(tǒng),并在產(chǎn)能智能化組織調(diào)度、機器翻譯以及人機共譯等三大關(guān)鍵核心NLP技術(shù)領(lǐng)域取得突破進展。語聯(lián)網(wǎng)提出新的交付標(biāo)準(zhǔn)“HWD”,即交付速度的計量記錄刷新: 十萬字以小時(HOUR)計,百萬字以天(DAY)計,千萬字以周(WEEK)計,將來還可能進一步提升。
會議最后,傳神語聯(lián)創(chuàng)始人兼董事長何恩培表示,“信息大爆炸時代讀取信息的對象,已經(jīng)從單純的人類,變?yōu)榱巳伺c機器同時閱讀和處理。因此多語信息的處理,不僅要做好效能提升,更要在此基礎(chǔ)上進行創(chuàng)新突破,打破人力處理能力的瓶頸和界限,銜接好人與機器,這是身處多語信息處理領(lǐng)域所有企業(yè)的共同使命。”
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )