原標(biāo)題:360數(shù)科榮登OCR國際賽事榜首,前沿科技探索再獲佳績
日前,360數(shù)科在ICDAR 2019 SROIE國際大賽OCR單項(xiàng)任務(wù)中,超越眾多AI大咖拔得頭籌。ICDAR(國際文檔分析與識別大會(huì))有著“OCR奧斯卡”之稱,賽事兼具權(quán)威性與挑戰(zhàn)性,目前已吸引148個(gè)國家的頂尖隊(duì)伍參與。
360數(shù)科本次參加的文本識別算法大賽通道,一方面極其貼近真實(shí)業(yè)務(wù)場景,對企業(yè)技術(shù)應(yīng)用效果提出了極高要求,一方面以Recall、Precision、Hmean為核心評價(jià)指標(biāo),考驗(yàn)企業(yè)技術(shù)精準(zhǔn)度。此次成績的獲取,標(biāo)志著360數(shù)科技術(shù)能力再次受到國際認(rèn)可。
隨著大數(shù)據(jù)、人工智能的蓬勃發(fā)展,OCR性能的不斷提升為產(chǎn)業(yè)數(shù)字化催生的應(yīng)用場景提供了堅(jiān)實(shí)支撐。同時(shí),覆蓋移動(dòng)端和云端的多樣化服務(wù)載體,進(jìn)一步加快了OCR的普及。然而,OCR技術(shù)所面對的挑戰(zhàn)與其發(fā)展并存,彎曲文本、長文本、不同語種、生僻字符以及手寫體文字識別等難點(diǎn)仍在尋求更好的解決方案。
360數(shù)科在本次競賽中,提出了一種基于RARE改進(jìn)的新文本識別算法,并與優(yōu)化后的CRNN模型進(jìn)行了模型融合,并在此基礎(chǔ)上使用了帶有初始值的center loss。除了模型優(yōu)化外,360數(shù)科還利用大規(guī)模公開數(shù)據(jù)集用于預(yù)訓(xùn)練模型,并且生成了大量與訓(xùn)練集相同圖像風(fēng)格的仿真數(shù)據(jù),在預(yù)訓(xùn)練模型的基礎(chǔ)上進(jìn)行finetune。最后,應(yīng)用已訓(xùn)練完成的自然語言模型,糾正文本識別中的錯(cuò)誤。
自2018年,360數(shù)科就開始積極探索如何將OCR技術(shù)應(yīng)用于業(yè)務(wù)。目前已結(jié)合業(yè)務(wù)實(shí)際情況,建立了多個(gè)通用文檔圖像數(shù)據(jù)集,包括并不限學(xué)歷認(rèn)證、執(zhí)業(yè)證書認(rèn)證、票據(jù)識別、行駛證識別、駕駛證識別和營業(yè)執(zhí)照等。目前該算法在上述業(yè)務(wù)場景字段精度均高達(dá)95%以上。
據(jù)360數(shù)科首席算法科學(xué)家費(fèi)浩峻介紹,360數(shù)科一直把業(yè)務(wù)作為技術(shù)成長的最有力土壤,技術(shù)研究要植根于業(yè)務(wù),并超前于業(yè)務(wù),本次ICDAR 競賽便是對業(yè)務(wù)實(shí)踐過程中技術(shù)積累的一個(gè)有效檢驗(yàn)。未來,除了對端到端網(wǎng)路結(jié)構(gòu)的進(jìn)一步探索,如何設(shè)計(jì)更適用于移動(dòng)端使用的輕量化模型也是公司OCR技術(shù)的重點(diǎn)研究方向,只有兼顧效率和精準(zhǔn)度的模型才能更好服務(wù)于用戶。當(dāng)前,OCR技術(shù)已在金融、保險(xiǎn)、醫(yī)療、交通、教育等諸多行業(yè)有了深入成熟的應(yīng)用。未來隨著傳統(tǒng)行業(yè)的數(shù)字化轉(zhuǎn)型,OCR應(yīng)用范圍和場景將進(jìn)一步擴(kuò)展,市場規(guī)模將進(jìn)一步增大。360數(shù)科將在更多前沿技術(shù)探索中,以自身科技能力,壯大金融科技賦能實(shí)體的力量。
國際文檔分析與識別大會(huì) ICDAR( International Conference on Document Analysis and Recognition)自 1991 年開始,每兩年一屆。自 2003 年大會(huì)開始設(shè)立技術(shù)競賽,ICDAR 競賽因其極高技術(shù)難度和強(qiáng)大實(shí)用性,一直是各大科研院校、科技公司的競逐焦點(diǎn),吸引國內(nèi)外眾多隊(duì)伍參賽。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。