移動AI普及背后的故事——來自三星電子中國研究院的人們與創(chuàng)新
在三星不斷創(chuàng)新,持續(xù)引領卓越移動AI體驗的背景下,我們拜訪了位于世界各地的三星電子研究院,力求探究Galaxy AI是如何助力用戶釋放無限潛能的。如今,Galaxy AI憑借已支持的16種語言,可以服務更多不同語種的用戶,即便是在離線狀態(tài)下,用戶也能利用基于端側AI的通話實時翻譯、翻譯助手、筆記助手和瀏覽助手等功能,跨越語言壁壘。那么,關于Galaxy AI語言翻譯的研發(fā),又有哪些背后的故事呢?上一期,我們拜訪了位于越南的三星電子研究院,了解了用于AI模型訓練的數(shù)據是如何收集的。這一期,我們將走近中國團隊,看他們是如何為中國用戶們提供獨特的Galaxy AI體驗的。
在全球范圍內,基于大語言模型(LLM)的AI工具正在飛速發(fā)展,中國也不例外。隨著百度 ERNIE Bot 和美圖 Miracle Vision的發(fā)展普及,三星電子中國研究院也選擇了與這兩家公司深入合作,共同打造屬于中國市場的Galaxy AI功能。
攜手不同AI合作伙伴,使得Galaxy AI在后端乃至底層技術的整合面臨了巨大的挑戰(zhàn),但三星電子中國研究院的北京和廣州團隊必須在規(guī)定的時間內,讓中國用戶獲得與全球其他用戶相同的 Galaxy AI 體驗。因此,他們利用第三方合作伙伴提供的中國方言專用資源,為中國用戶打造了獨一無二的 Galaxy AI 解決方案。
三星電子廣州研究院軟件創(chuàng)新團隊負責人張海榕表示:“我們的優(yōu)勢在于能夠將全球最好的實踐經驗與中國本土的實踐經驗相融合,并通過與中國用戶的日常交流了解用戶的需求,不斷改進提升,開發(fā)新功能。我們的團隊憑借在Galaxy S24項目中積累的豐富開發(fā)經驗,與百度、美圖等中國本土人工智能公司攜手合作,帶來了真正贏得用戶共鳴的解決方案,對此我深感自豪。”
一開始,各團隊都需要適應彼此的工作方式,并解決項目初期信息不對等的問題。對此,三星電子中國研究院院長張代君成立了一個特別工作組,以確保項目能夠按照研發(fā)規(guī)劃快速地推進并完成目標。
憑借北京團隊在大模型生成方面的豐富經驗,以及與第三方合作伙伴的成功合作,所有的生成式AI功能最終在中國成功問世,為中國用戶帶來了更為本土化的具備特定市場功能(如“觸摸搜索”)的解決方案。
基于中文開發(fā)粵語方言模型
早在2024年1月Galaxy S24上市之際,Galaxy AI便已支持了普通話,但對于三星電子中國研究院而言,工作仍未結束。在此之后,中國團隊投入到了支持粵語的AI模型研發(fā)工作中。該項研究將在普通話語言模型的基礎上,進一步解決粵語語言特征所帶來一系列新問題。
在粵語AI語言模型的開發(fā)過程中,研發(fā)團隊面臨的主要難題就是文化方面的差異。首先,中國香港的書寫和口語是兩套不同的系統(tǒng)。中國香港用戶在書寫時使用類似普通話的語法和表達方式,而在日常交流時則采用完全不同的口語語法。此外,粵語發(fā)音有九個聲調,而普通話則有四個。
另一個文化差異則是粵語方言本身也在與時俱進,并且很多時候人們經常會在對話中將粵語和英語混在一起用,因此,創(chuàng)建測試用例、驗證語言包的復雜程度不言而喻。
"粵語是一種非常獨特的方言,在不同的粵語地區(qū)會有不同的說法,"負責粵語AI解決方案測試工作的李靖表示,"一些俚語、短語、詞匯甚至音調在不同地方都不盡相同。因此,我們對大量中國香港的詳細數(shù)據進行了核對,并校對了數(shù)以萬計的相關測試案例。"
考慮到這些復雜性,三星電子中國研究院的北京和廣州團隊合作實現(xiàn)了在粵語和英語的混合語音識別中支持深層代碼混合、在機器翻譯中支持書面和口語表達、在語音合成中使用當前的發(fā)音。
溝通中的文化影響
當Galaxy AI的粵語語言包可供使用時,消費者的反饋很好地表明了三星研發(fā)團隊的辛勤工作都是值得的。
三星Galaxy AI的項目經驗表明,不管是在中國大陸還是中國中國香港地區(qū),一個全球品牌不僅應擁有專業(yè)的當?shù)貓F隊和相關的當?shù)刂R,還要具備與當?shù)氐谌胶献骰锇殚_展開放合作的能力。在中國中國香港地區(qū),粵語是構建當?shù)鼐用裎幕匦缘闹匾糠帧榇?,當?shù)貓F隊必須研發(fā)正確的人工智能語言模型。
三星電子中國中國香港地區(qū)負責人Henry Wat表示:“在任何地方、任何行業(yè)中,語言以及溝通交流都非常重要。無論是來自哪里的語言,任何能幫助人們溝通交流的工具都是非??少F的,我堅信我們的工作很有意義。”
在下一期《學習曲線》中,我們將前往巴西,了解一個團隊如何跨越文化和國界,讓更多人體驗到Galaxy AI。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )