談起OCR(光學(xué)字符識(shí)別,Optical Character Recognition)應(yīng)用,很多人并不陌生,其最常見(jiàn)的應(yīng)用場(chǎng)景就是實(shí)現(xiàn)“圖片轉(zhuǎn)換成文字”,并廣泛應(yīng)用于如掃描名片并加入通訊錄、拍攝英文菜單并將其翻譯成中文等需求之中。經(jīng)歷長(zhǎng)期的發(fā)展之后,OCR應(yīng)用的準(zhǔn)確率、速度都有了顯著提升,實(shí)用性也越來(lái)越高。
雖然當(dāng)前的OCR應(yīng)用已經(jīng)能夠應(yīng)對(duì)大多數(shù)消費(fèi)類的場(chǎng)景,但是在商業(yè)化應(yīng)用場(chǎng)景中,OCR 的識(shí)別效率仍存在廣泛的提速需求。在AI技術(shù)引領(lǐng)的下一代測(cè)試中,北京云測(cè)信息技術(shù)有限公司*(以下簡(jiǎn)稱:Testin云測(cè))發(fā)布全新AI測(cè)試產(chǎn)品iTestin,全面提升測(cè)試產(chǎn)品的易用性和自動(dòng)化效率,在提升腳本編寫效率一倍的同時(shí),將腳本的維護(hù)成本降低了一倍。其使用了 OCR 深度學(xué)習(xí)方案來(lái)支持控件定位的輸入,OCR 識(shí)別速度越快,就越有助于自動(dòng)化速度測(cè)試的提升。為此,Testin云測(cè)基于英特爾® 至強(qiáng)® 可擴(kuò)展處理器、英特爾® OpenVINO™ 工具套件對(duì) OCR 深度學(xué)習(xí)方案進(jìn)行優(yōu)化,將AI測(cè)試中的OCR識(shí)別時(shí)間從2秒降低到0.3秒左右,實(shí)現(xiàn)了6倍的性能提升,且不影響測(cè)試的效果和結(jié)果。
當(dāng)AI測(cè)試遇上OCR,開(kāi)啟下一代測(cè)試
要開(kāi)發(fā)出一款軟件應(yīng)用并將其投入到實(shí)際運(yùn)營(yíng)中,并不是很多人想象中的那樣,找一些程序員寫一些代碼就能簡(jiǎn)單完成的事情,而是涉及到一套完整、復(fù)雜的流程。很多開(kāi)發(fā)者甚至認(rèn)為,測(cè)試是開(kāi)發(fā)過(guò)程中最繁瑣的環(huán)節(jié)之一。在軟件完成初步開(kāi)發(fā)之后,開(kāi)發(fā)人員需要測(cè)試其功能是否可用、在不同型號(hào)的設(shè)備(如基于安卓系統(tǒng)的設(shè)備與基于iOS系統(tǒng)的設(shè)備)上有什么應(yīng)用問(wèn)題。此外,不同的軟件在各區(qū)域?qū)嶋H網(wǎng)絡(luò)環(huán)境中的表現(xiàn)也可能會(huì)有差異,這些都需要進(jìn)行詳盡的測(cè)試。
為了幫助開(kāi)發(fā)者對(duì)軟件進(jìn)行測(cè)試,Testin云測(cè)全球首創(chuàng)了云測(cè)試的模式,并在此基礎(chǔ)上,推出了融合AI技術(shù)的下一代測(cè)試產(chǎn)品iTestin。開(kāi)發(fā)者可以將軟件上傳到該平臺(tái)進(jìn)行自動(dòng)化測(cè)試,Testin云測(cè)會(huì)詳盡列出測(cè)試環(huán)節(jié)中的所有參數(shù),并會(huì)提供自動(dòng)輸出錯(cuò)誤、報(bào)警等測(cè)試日志服務(wù),出具專業(yè)化測(cè)試報(bào)告,以幫助開(kāi)發(fā)者快速定位可能出現(xiàn)的問(wèn)題,對(duì)軟件進(jìn)行持續(xù)優(yōu)化?! ?/p>
在AI測(cè)試過(guò)程中,Testin云測(cè)發(fā)現(xiàn),自動(dòng)化框架本身提供的控件輸入不穩(wěn)定。因此,Testin云測(cè)的AI測(cè)試方案傾向于使用更穩(wěn)定的手機(jī)截屏,做為控件定位的輸入,這就要求使用 OCR 技術(shù)來(lái)定位和解析屏幕截圖中的文本。由于 OCR 的效率與準(zhǔn)確度會(huì)對(duì)測(cè)試的效果與結(jié)果帶來(lái)不可忽視的影響,而模板匹配、特征提取等傳統(tǒng) OCR 方案又暴露出對(duì)于圖像清晰度要求高、抗背景干擾能力較差等缺陷,所以Testin云測(cè)決定使用深度學(xué)習(xí)方案來(lái)提升文本推理能力。
為了提升 OCR 深度學(xué)習(xí)的效率,Testin云測(cè)與英特爾進(jìn)行了深度合作,從軟件加速以及硬件兩個(gè)角度對(duì)于 OCR 方案進(jìn)行優(yōu)化。
至強(qiáng)+OpenVINO™ 將 OCR 效率提升6倍
在很多情況下,OCR 深度學(xué)習(xí)方案使用的都是 GPU,通過(guò)其強(qiáng)大的并行計(jì)算能力來(lái)提升文本推理能力。但是,GPU 方案也存在很多缺陷。特別是在較小規(guī)模、私有云用戶的深度學(xué)習(xí)應(yīng)用中,搭建專用于 OCR 深度學(xué)習(xí)的 GPU 平臺(tái)需要客戶同時(shí)升級(jí)硬件平臺(tái),這樣不僅耗費(fèi)時(shí)間成本,而且也會(huì)帶來(lái)相應(yīng)的硬件升級(jí)成本,更多用戶希望在現(xiàn)有的基礎(chǔ)設(shè)施平臺(tái)上運(yùn)行深度學(xué)習(xí)負(fù)載。而且,在大量推理負(fù)載中,基于 CPU 的推理性能并不弱于 GPU 平臺(tái),這也成為Testin云測(cè)進(jìn)行方案驗(yàn)證的重要?jiǎng)恿Α?/p>
在基礎(chǔ)設(shè)施平臺(tái)的搭建上,Testin云測(cè)最終選擇了英特爾® 至強(qiáng)® 金牌 6140處理器,該處理器是英特爾® 至強(qiáng)® 可擴(kuò)展處理器家族產(chǎn)品,不僅擁有強(qiáng)大的通用計(jì)算能力,還集成了增強(qiáng)單指令多數(shù)據(jù)流(Single Instruction Multiple Data,SIMD)、英特爾® AVX-512等創(chuàng)新技術(shù),實(shí)現(xiàn)了對(duì)于通用計(jì)算能力和并行計(jì)算能力的兼顧,為深度學(xué)習(xí)訓(xùn)練提供了卓越的性能基礎(chǔ)。相比上一代產(chǎn)品,英特爾® 至強(qiáng)® 可擴(kuò)展處理器針對(duì)深度學(xué)習(xí)訓(xùn)練和推理可提供高達(dá)2.2倍的性能。結(jié)合可加快交付人工智能服務(wù)的軟件優(yōu)化,相比3年前未經(jīng)優(yōu)化的服務(wù)器系統(tǒng),全新的處理器可實(shí)現(xiàn)113倍的深度學(xué)習(xí)性能提升。
在軟件與算法層面上,Testin云測(cè)對(duì)深度學(xué)習(xí)框架、加速方案也進(jìn)行探索和選擇。為了加速 OCR 方案,Testin云測(cè)在初期使用的深度學(xué)習(xí)框架是Google* 開(kāi)發(fā)的TensorFlow*,TensorFlow將深度學(xué)習(xí)復(fù)雜的計(jì)算過(guò)程抽象成數(shù)據(jù)流圖,在深度學(xué)習(xí)中有著廣泛的應(yīng)用。但是,Testin云測(cè)發(fā)現(xiàn),無(wú)論是公開(kāi)版本的 TensorFlow,還是優(yōu)化版本的 TensorFlow,在速度上都無(wú)法滿足需求。因此,Testin云測(cè)希望能夠找到一種全新的加速方案。
在英特爾的建議下,Testin云測(cè)嘗試使用英特爾® OpenVINO™ 工具套件分發(fā)版來(lái)進(jìn)行加速。該工具套件支持開(kāi)發(fā)人員使用行業(yè)標(biāo)準(zhǔn)人工智能框架、標(biāo)準(zhǔn)或自定義層,將深度學(xué)習(xí)推理輕松集成到應(yīng)用中,開(kāi)發(fā)人員只需編寫一次代碼,即可將其快速、無(wú)縫地部署在當(dāng)前和未來(lái)的英特爾硬件上,從而消除應(yīng)用重復(fù)開(kāi)發(fā)問(wèn)題。該工具套件基于卷積神經(jīng)網(wǎng)絡(luò) (CNN),可在英特爾硬件中擴(kuò)展工作負(fù)載。
OpenVINO™ 的采用帶來(lái)了立竿見(jiàn)影的效果,Testin云測(cè)針對(duì)公共 TensorFlow 與英特爾® OpenVINO™ 實(shí)現(xiàn)的推理吞吐量進(jìn)行了測(cè)試,并發(fā)現(xiàn),基于公共 TensorFlow 的解決方案的推理吞吐量為 23.26 (FPS) ,基于英特爾® OpenVINO™ 的解決方案的推理吞吐量為 151.29 (FPS) ,后者比前者的吞吐量提升650%左右(對(duì)比結(jié)果如圖1),而且基本沒(méi)有精度損失?! ?/p>
此外,Testin云測(cè)還基于第二代英特爾® 至強(qiáng)® 可擴(kuò)展處理器進(jìn)行了測(cè)試,該處理器集成了英特爾® 深度學(xué)習(xí)加速(英特爾® Deep Learning Boost)技術(shù)、DL Boost(VNNI)技術(shù),以加速數(shù)據(jù)中心、企業(yè)和智能邊緣計(jì)算環(huán)境中的人工智能推理工作負(fù)載。特別是在搭配支持低精度的INT8加速的 OpenVINO™ 新版本之后,有望將推理速度在提升3倍左右。
以AI賦能測(cè)試服務(wù)
目前,Testin云測(cè)的業(yè)務(wù)范疇,不僅包括測(cè)試服務(wù),還包括安全、推廣,以及AI數(shù)據(jù)標(biāo)注等服務(wù)。通過(guò)開(kāi)發(fā)基于人工智能 (AI)、深度學(xué)習(xí)技術(shù)的數(shù)據(jù)標(biāo)注、OCR 識(shí)別等相關(guān)AI測(cè)試工具,Testin云測(cè)可以幫助企業(yè)客戶完成自動(dòng)化應(yīng)用測(cè)試,大幅降低勞動(dòng)密集度。
通過(guò)將 AI 與自動(dòng)化測(cè)試解決方案結(jié)合,能夠有助于自動(dòng)化、全路徑探索應(yīng)用的各種顯在或是潛在問(wèn)題,提取特征訓(xùn)練進(jìn)行業(yè)務(wù)功能的識(shí)別,并智能生成測(cè)試報(bào)告。AI 的加入還有助于實(shí)現(xiàn)對(duì)功能模塊的自動(dòng)探索,并實(shí)現(xiàn)執(zhí)行過(guò)程的可視化,使得測(cè)試環(huán)節(jié)定位更加迅速準(zhǔn)確。對(duì)于用戶來(lái)說(shuō),自動(dòng)化的測(cè)試管理和測(cè)試用例創(chuàng)建能夠顯著降低測(cè)試時(shí)間與資源的浪費(fèi),加快應(yīng)用上市進(jìn)程。
Testin云測(cè)的測(cè)試實(shí)例證明,英特爾® 至強(qiáng)® 可擴(kuò)展處理器+英特爾® OpenVINO™ 的融合解決方案有助于在具體應(yīng)用場(chǎng)景中加快推理的速度。而且,該解決方案還展現(xiàn)了其它自動(dòng)化測(cè)試場(chǎng)景的應(yīng)用潛力,為用戶搭建基礎(chǔ)平臺(tái)提供了重要的方案選擇。(來(lái)源:ChinaIT.com)
- 為什么年輕人不愛(ài)換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來(lái)”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見(jiàn)“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場(chǎng)定位清晰,攜手共進(jìn),核心技術(shù)決定未來(lái)
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。