近日,第二十六屆ICONIP國際神經(jīng)信息處理學術會議(The 26th International Conference on Neural Information Processing, ICONIP)在澳大利亞悉尼召開,平安科技自動化機器學習平臺(AutoML)----奧卡姆Occam平臺研究成果《On Probability Calibration of Recurrent Text Recognition Network》正式亮相,并受邀在大會上進行主題演講。這是繼在斯坦福大學深度學習推理DAWNBench競賽獲得冠軍、獲得2019年CCF科學技術獎科技進步杰出獎后,平安科技奧卡姆平臺的又一項重大突破。
ICONIP會議是由亞太神經(jīng)網(wǎng)絡協(xié)會APNNS(Asia-Pacific Neural Network Society)主辦的人工智能神經(jīng)網(wǎng)絡領域最重要的會議之一。本次會議特別邀請到了神經(jīng)網(wǎng)絡領域權威專家David Powers 和 Bao-Liang Lu等嘉賓出席并進行主題分享,并匯聚了來自世界各地從事人工智能理論和應用研究的頂尖研究人員,共同分享國際人工智能研究領域的最新理論和技術成果。會議共收到1200+篇來自世界頂尖學府和科研機構的論文投稿,最終錄用337篇,會議錄用率僅為27.4%,而受到邀請進行主題演講的文章更是屈指可數(shù)。
圖1 第26屆ICONIP
平安科技奧卡姆平臺研究成果發(fā)布
平安科技奧卡姆平臺研究成果《On Probability Calibration of Recurrent Text Recognition Network》是由平安集團首席科學家肖京博士指導,平安科技副總工程師王健宗博士作為論文的通訊作者,在會議錄用的337篇論文中脫穎而出,并受邀成為口頭報告論文。
奧卡姆平臺這篇論文針對OCR識別中未分段文本識別模型中的校準異常問題,創(chuàng)新性地將順序文字識別網(wǎng)絡(SRN)與校準卷積神經(jīng)網(wǎng)絡(Calibration CNN)相結(jié)合,提出了一種將未分段文本轉(zhuǎn)化為單個字符并進行識別校準的新型算法。不同于傳統(tǒng)算法針對一段文字中所有樣本均采用相同的模型參數(shù)的方式,奧卡姆采用的算法將未分段文本中的每個文字提取出來,雖然仍采用相同的識別模型,但是憑借奧卡姆平臺計算能力極強的優(yōu)勢,可以并對不同的個體文字自適應地選擇不同的校正參數(shù),調(diào)整每個文字識別結(jié)果的置信度輸出,從而降低置信度的誤差。而在此論文成果的真實應用中,通過使用奧卡姆平臺,高效、快速地在三個樣本集中試驗了五種不同的CNN參數(shù)校準方式,并得出了以DenseNet結(jié)構的為基礎的最佳識別校準算法。
圖2 奧卡姆論文提出的校準方式
本論文的研究成果可利用在金融、保險、醫(yī)療等領域?qū)ㄗC、財務票據(jù)等信息進行智能識別錄入。以智能投保場景為例,用戶可利用論文中的技術,對駕駛證、行駛證等證件上的未分段信息進行識別,實現(xiàn)車主信息的自動識別和錄入。在手機移動投保、信息核實等過程中有效提升運營效率,優(yōu)化用戶體驗。
定義全新的AI開發(fā)模式,Occam平臺屢獲殊榮Occam平臺是平安集團研發(fā)的搭建在大規(guī)模GPU集群上的一站式AI開發(fā)平臺,為用戶提供了從數(shù)據(jù)處理、算法開發(fā)、模型訓練、模型優(yōu)化到模型推理的全周期AI工作流,并且包含數(shù)據(jù)標注、數(shù)據(jù)增強、多元模型自動搜索、超參優(yōu)化、模型自動壓縮、圖神經(jīng)網(wǎng)絡、聯(lián)邦學習、難例自動發(fā)現(xiàn)等多種特色工具和服務。
圖3 奧卡姆平臺概覽
2019年,Occam平臺的多項優(yōu)秀成果得到國內(nèi)計算機領域權威學術團體的肯定。不僅首次榮獲"2019年CCF科學技術獎科技進步杰出獎",還在斯坦福大學深度學習推理DAWNBench競賽中,力壓由康奈爾大學和谷歌組成的豪華聯(lián)隊,以7.579毫秒的驚人成績勇奪冠軍。
當前Occam平臺已落地平安產(chǎn)險,并為平安聲紋、AI音樂、智能視覺等多個AI團隊項目提供平臺支持。例如:Occam平臺實現(xiàn)了首個基于神經(jīng)架構搜索的聲紋識別模型Auto-Vector,只需要30GPUh就可以在VCTK數(shù)據(jù)集搜索一個高精度聲紋識別模型,其效果遠超過如Xvector、LSTM-GE2E等最先進的頂級專家設計的聲紋模型,并且聲紋模型訓練最高可達到90%的訓練提速。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- GitLab將告別中國區(qū)用戶:是時候選擇新的“極狐”或保護賬號了
- 蘋果明年推至少22款新品,阿里非洲首站啟動,科技新品盛宴拉開帷幕
- SUSE預測:未來私有AI平臺崛起,讓我們共同見證AI的未來
- AI伴侶“小奇”:奇富科技重塑金融服務體驗的探索之作
- 揭秘軟銀孫正義神秘芯片計劃:打造超越NVIDIA的未來科技新星
- 大模型創(chuàng)企星辰資本獲數(shù)億融資,騰訊啟明等巨頭入局,人工智能新篇章開啟
- 大模型獨角獸階躍星辰融資新動態(tài):數(shù)億美金B(yǎng)輪,揭秘星辰未來之路
- 哪吒汽車創(chuàng)始人資金遭凍結(jié),1986萬元股權風波引關注
- 本田與日產(chǎn)醞釀合并:明年6月敲定協(xié)議,新公司社長待本田推薦
- 金融大模型新突破:百川智能Baichuan4-Finance引領行業(yè),準確率領先GPT-4近20%,變革金融業(yè)未來
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。