在人工智能領域,場景應用、平臺建設是并行的,如何打通多項AI能力,提供融合的智能服務,對國內AI企業(yè)提出了挑戰(zhàn)。捷通華聲作為國內人工智能產業(yè)的開拓者與領導者,早在2011年就推出了全球首個全方位人工智能平臺——靈云(AIcloud.com)。
該平臺融合智能語音、智能圖像、生物特征識別、智能語義等12項人工智能技術,并面向產業(yè)全面開放。為此,作為中國軟件網(wǎng)策劃的“2018中國AI應用、平臺與生態(tài)”系列專訪第二期,我們采訪了捷通華聲總經(jīng)理武衛(wèi)東,跟他聊一聊人智能應用和人工智能開放平臺的發(fā)展邏輯,以及捷通華聲的一些實踐經(jīng)驗。
深化應用、構建平臺,是人工智能廠商的未來
根據(jù)中國軟件網(wǎng)《2018中國人工智能應用與生態(tài)研究報告》中調研數(shù)據(jù)顯示,38%的人認為我國人工智能產業(yè)目前處于應用擴展、平臺建設階段;33%的人認為我國人工智能產業(yè)已經(jīng)進入平臺競爭、生態(tài)建設階段??梢?,大部分人都認為我國正在進行AI平臺和生態(tài)建設。
值得提出的是,應用落地和平臺、生態(tài)建設是同步并舉,人工智能廠商之間的競爭將在多個維度同時進行。要建成完善的AI平臺和生態(tài),預計還有5~10年時間。
武衛(wèi)東認為,通過構建人工智能開放平臺的方式,深化行業(yè)應用、聚集合作伙伴,進而構建人工智能產業(yè)生態(tài)是捷通華聲重要的戰(zhàn)略布局。捷通華聲在這方面很早就進行了積極的探索,2011年,捷通華聲的靈云平臺就面向產業(yè)全面開放,并以“云 + 端”方式,為產業(yè)界提供語音合成(TTS)、語音識別(ASR)、麥克風陣列(SMA)、語音喚醒(VW)、手寫識別(HWR)、光學字符識別(OCR)、人臉識別(AFR)、聲紋識別(VPR)、指紋識別(FPR)、自然語言理解(NLU)、數(shù)據(jù)挖掘(DM)、機器翻譯(MT)等全方位人工智能能力。通過將其積累的人工智能技術開放出來,捷通華聲積累了眾多的合作伙伴,并服務大量的行業(yè)客戶。
融合多項智能應用,打通整個智能產業(yè)鏈條
武衛(wèi)東指出,目前人工智能廠商大多提供單一的智能服務,比如語音識別、圖像識別等,多項智能應用的融合度不高。但是就市場需求來看,用戶想要的往往是多項智能服務,并且這些不同領域的智能應用要很好的融合,形成完善的解決方案。
捷通華聲作為在智能語音領域領先的廠商,其能力不僅局限于語音領域,已經(jīng)擴展到智能圖像、智能語義、生物特征識別等領域。具體來看,捷通華聲提供的智能服務包括:
智能語音領域,捷通華聲能具備正確率為97%以上的語音識別能力,并能實現(xiàn)21種語言的語音合成服務,以及語義理解能力。另外,捷通華聲還提供獨具特色的聲紋識別應用,可以根據(jù)說話人的語音特征,提供聲紋鑒別和聲紋確認,并作為生物特征識別的重要手段;
智能圖像領域,捷通華聲提供的OCR服務,除了支持識別漢語、英語之外,還支持維語、蒙語、藏語、朝鮮語、哈薩克、彝族等多種少數(shù)民族語言的識別。更進一步的,捷通華聲具備手寫識別能力,能將手寫字跡轉化成文本,識別準確率在99.9%以上。此外,捷通華聲還支持人臉識別和指紋識別應用。
值得提出的是,捷通華聲通過靈云平臺來提供這些智能應用,致力于實現(xiàn)不同種類智能服務的融合,而不是簡單的產品堆砌。在武衛(wèi)東看來,單項智能的局限性較大,未來必然是多項智能的高度融合。為此,捷通華聲突出全方位人工智能的能力建設,并以靈云平臺為載體,向開發(fā)者、合作伙伴開放出來,共同賦能整個智能生態(tài)的發(fā)展。
融合生物特征識別,提供個性化智能服務
構建人工智能平臺,不是單純的將各項AI能力放上去就可以,要發(fā)揮作用必然要理順內部的業(yè)務邏輯。在與武總的交流中,給我啟發(fā)比較大的是捷通華聲基于生物特征識別打通智能服務鏈條的構想和實踐。
在捷通華聲看來,人工智能應用的一個重要價值,就是對不同用戶提供高度符合其需求的相關服務。在以前,針對特定個體提供定制化服務只在很有限的范圍內實現(xiàn),比如對VIP客戶的服務?,F(xiàn)在,由于數(shù)據(jù)的積累和智能化技術的發(fā)展,基于數(shù)據(jù)分析的用戶畫像和定制化服務,無論從技術難度還是經(jīng)濟效益上來說,都具備了實現(xiàn)的可能。而要實現(xiàn)對不同個體的定制化服務,關鍵的第一步就是對實現(xiàn)特定個體的識別。在互聯(lián)網(wǎng)時代,人們大多通過各類賬戶來實現(xiàn)用戶識別;在智能時代,基于生物特征的用戶識別將成為常態(tài),比較典型的就是人臉識別和指紋識別。另外,捷通華聲還提供獨具特色的聲紋識別服務,可以根據(jù)一個人聲音特點來進行身份識別和驗證。
通過人臉、聲紋、指紋等生物特征識別技術,加上數(shù)據(jù)分析和用戶畫像,就可以打通整個智能服務鏈條,給用戶帶來實時、智能的服務體驗。為此,他描述了這樣一個場景:一個銀行用戶進入銀行,通過人臉識別、聲紋識別技術,系統(tǒng)可以根據(jù)對用戶面部和聲音的識別知道他的身份,再通過對系統(tǒng)內該用戶記錄和用戶畫像的分析,推測出該用戶的需求,并提供不同的服務。比如根據(jù)系統(tǒng)分析,如果一個用戶屬于風險厭惡型的,在推薦理財產品時就會選取低風險產品;如果分析出該用戶是激進型的,則推薦高風險、高收益的理財產品。這樣,可以大大提升用戶體驗,提升用戶粘性。這樣一套系統(tǒng)充分體現(xiàn)了人工智能相對于人的優(yōu)越性,在上述場景中,銀行大堂經(jīng)理是不可能對進入銀行的每個用戶都能全面了解的。通過人工智能與大數(shù)據(jù)技術,以及多項AI能力的融合,構建的這套系統(tǒng)能實現(xiàn)基于身份認證的個性化智能服務,這也是靈云平臺的優(yōu)勢所在。
攜手合作伙伴,共鑄智能生態(tài)
作為成立于2000年并一直全面發(fā)展人工智能云服務的高新技術企業(yè),捷通華聲不僅提供智能語音、智能圖像、生物特征識別、智能語義等全方位人工智能技術研究與應用,也與眾多伙伴一起,推展更豐富的應用領域,搭建互利共贏得智能生態(tài)。
基于靈云平臺,捷通華聲致力于用AI技術促進產品產業(yè)升級,鞏固合作伙伴行業(yè)地位,幫助合作伙伴落地AI業(yè)務場景,共同構建AI全鏈條的行業(yè)生態(tài)。為了最大化支持合作伙伴,捷通華聲可提供公有云、私有云服務及綜合智能解決方案,并針對不同產品靈活變換合作模式。此外還提供全套的技術培訓支持,包括靈云AI產品課程培訓、業(yè)務分享沙龍、在線視頻技術學習等,并在聯(lián)合推廣營銷方面給予合作伙伴大量的支持。
在人工智能的各個領域,平臺化、生態(tài)化趨勢日益明顯,其平臺和生態(tài)建設路徑一般是:通過AI技術賦能各個行業(yè),找到一些適合AI應用的領域快速商業(yè)化和規(guī)?;患涌鞈妙I域拓展、行業(yè)深耕和客戶資源的積累;搭建人工智能平臺,實現(xiàn)生態(tài)化發(fā)展??傮w來看,捷通華聲也基本遵循了這一發(fā)展路徑,在發(fā)展出眾多AI能力之后,構建人工智能平臺,攜手合作伙伴共建智能生態(tài),未來必將取得更大的成績。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- GitLab將告別中國區(qū)用戶:是時候選擇新的“極狐”或保護賬號了
- 蘋果明年推至少22款新品,阿里非洲首站啟動,科技新品盛宴拉開帷幕
- SUSE預測:未來私有AI平臺崛起,讓我們共同見證AI的未來
- AI伴侶“小奇”:奇富科技重塑金融服務體驗的探索之作
- 揭秘軟銀孫正義神秘芯片計劃:打造超越NVIDIA的未來科技新星
- 大模型創(chuàng)企星辰資本獲數(shù)億融資,騰訊啟明等巨頭入局,人工智能新篇章開啟
- 大模型獨角獸階躍星辰融資新動態(tài):數(shù)億美金B(yǎng)輪,揭秘星辰未來之路
- 哪吒汽車創(chuàng)始人資金遭凍結,1986萬元股權風波引關注
- 本田與日產醞釀合并:明年6月敲定協(xié)議,新公司社長待本田推薦
- 金融大模型新突破:百川智能Baichuan4-Finance引領行業(yè),準確率領先GPT-4近20%,變革金融業(yè)未來
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。