2018年7月,在國(guó)際權(quán)威計(jì)算機(jī)視覺(jué)競(jìng)賽PASCAL VOC comp4目標(biāo)檢測(cè)競(jìng)賽中,Yi+ AI團(tuán)隊(duì)獲得了目標(biāo)檢測(cè)單模型第一名,超越了現(xiàn)有排行榜中的微軟研究院、谷歌 、阿里達(dá)摩院、Face++等國(guó)內(nèi)外眾多知名公司,以精度90.7%的成績(jī)打破了世界記錄,成為世界第一家總成績(jī)突破90%計(jì)算機(jī)視覺(jué)企業(yè)。同時(shí)在Pascal VOC“comp3”中,首次突破80%,刷新世界紀(jì)錄。
Pascal VOC comp4是眾多國(guó)內(nèi)外企業(yè)物體檢測(cè)團(tuán)隊(duì)證明自己實(shí)力的地方,此次Yi+力壓群雄,取得了90.7%的成績(jī),比第二名的阿里達(dá)摩院高了1.5個(gè)百分點(diǎn),在物體檢測(cè)領(lǐng)域,1.5個(gè)百分點(diǎn)意味著需要比對(duì)方“多”檢測(cè)正確6000多個(gè)框,同時(shí)值得注意的是,此次Yi+AI團(tuán)隊(duì)使用的是難度更高的單模型,而第二名的方法是多模型融合。
PASCAL VOC可謂視覺(jué)識(shí)別類(lèi)競(jìng)賽的鼻祖,包含了物體分類(lèi)、目標(biāo)檢測(cè)、圖像分割等任務(wù)。PASCAL VOC對(duì)計(jì)算機(jī)視覺(jué)的發(fā)展具有深遠(yuǎn)而巨大的影響,后續(xù)的ImageNet競(jìng)賽的任務(wù)設(shè)置就基本沿用了它的設(shè)定。此前,微軟、英特爾、CMU、Facebook、UC Berkeley等國(guó)際頂尖研發(fā)團(tuán)隊(duì)先后在這個(gè)排行榜上刷新紀(jì)錄。
Yi+AI的負(fù)責(zé)人表示,在此次Pascal VOC comp4競(jìng)賽中,Yi+AI團(tuán)隊(duì)使用的方法叫做FXRCNN,其中“X”,代表“多元”的意思,意味著Yi+AI使用的結(jié)構(gòu)不僅僅是高準(zhǔn)確率的模型,同時(shí)也適用多元場(chǎng)景,包括移植到移動(dòng)端(通過(guò)更改Backbone和Head),實(shí)現(xiàn)圖像分割(增加Mask分支),實(shí)現(xiàn)人體關(guān)鍵點(diǎn)(增加Key point分支),實(shí)現(xiàn)人臉檢測(cè)(增加Face分支)。
Yi+提交的深度學(xué)習(xí)模型,雖然采用了Faster RCNN的基本結(jié)構(gòu),但有很多不同之處:1)采用ResNeXt作為基礎(chǔ)網(wǎng)絡(luò),結(jié)合FPN實(shí)現(xiàn)多尺度特征融合,2)在后處理階段,采用SoftNMS和多框投票融合;3)通過(guò)Yi+海量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練;4)多尺度訓(xùn)練,進(jìn)一步加強(qiáng)數(shù)據(jù)增強(qiáng)。
近年來(lái)Yi+不斷加大對(duì)人工智能、大數(shù)據(jù)等新技術(shù)的研發(fā)和應(yīng)用,本次提交的模型,是Yi+多年來(lái)技術(shù)積累的結(jié)果,是通過(guò)不斷的攻克實(shí)際問(wèn)題的結(jié)果,是Yi+內(nèi)部模型不斷優(yōu)化的結(jié)果,Yi+ AI的FXRCNN在速度,內(nèi)存,精度,應(yīng)用范圍等多維度進(jìn)行了全面的優(yōu)化。
在人工智能領(lǐng)域,目標(biāo)檢測(cè)技術(shù)應(yīng)用廣泛,是Yi+AI場(chǎng)景落地的關(guān)鍵性技術(shù)之一。Yi+將目標(biāo)檢測(cè)技術(shù)應(yīng)用在圖像搜索引擎和圖片視頻結(jié)構(gòu)化引擎中,Yi+圖像搜索引擎可檢測(cè)類(lèi)目超100類(lèi),覆蓋服飾、3C商超、家居、日用品、交通工具等;Yi+圖片視頻結(jié)構(gòu)化引擎則采用目前業(yè)界最領(lǐng)先的基于深度學(xué)習(xí)的通用目標(biāo)檢測(cè)算法,支持超過(guò)300類(lèi)常用物體的目標(biāo)檢測(cè)、識(shí)別,可實(shí)現(xiàn)對(duì)視頻和圖像中的場(chǎng)景、人、車(chē)輛、物體(輪廓)檢測(cè)、識(shí)別、分割、跟蹤;可識(shí)別近10,000種物品,400種場(chǎng)景。
目前Yi+AI已將目標(biāo)檢測(cè)技術(shù)應(yīng)用在多個(gè)使用場(chǎng)景中,包括“智能硬件”、“營(yíng)銷(xiāo)”、“新零售”、“智慧城市”等解決方案,具體則應(yīng)用在場(chǎng)景廣告平臺(tái)、新零售平臺(tái)、大屏AI助手、智慧安防、智慧交通、智慧社區(qū)等多項(xiàng)領(lǐng)域之中。
下一步,Yi+將結(jié)合現(xiàn)有技術(shù)優(yōu)勢(shì)繼續(xù)深耕智慧城市、新零售、智能營(yíng)銷(xiāo)、智能硬件等多個(gè)領(lǐng)域,讓計(jì)算機(jī)看懂世界,用科技提供人工智能服務(wù),幫助人們看見(jiàn)非凡,see different。
Yi+獲得阿里巴巴等B輪融資。服務(wù)了眾多500強(qiáng)客戶(hù)。團(tuán)隊(duì)成員大多來(lái)自頂尖企業(yè)與高校,如哥倫比亞大學(xué)、帝國(guó)理工、耶魯、普林斯頓、普渡大學(xué)、新加坡國(guó)大、南洋理工、清華、北大等及微軟、IBM、英特爾、阿里巴巴、騰訊、百度、華為等企業(yè)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 量子隱形傳態(tài)通過(guò)普通光纜傳輸:打破神秘,探索未來(lái)通信新紀(jì)元
- 廣電約談“紅果短劇”:短劇發(fā)展需守規(guī)矩,不得踩紅線(xiàn)
- 長(zhǎng)城汽車(chē)探秘之旅:國(guó)產(chǎn)車(chē)抗造之謎,真相大解
- 2023:警惕數(shù)字化時(shí)代詐騙行為與AI戰(zhàn)爭(zhēng)的雙重沖擊
- OpenAI研發(fā)人形機(jī)器人,小米15Ultra月底發(fā)布,科技新動(dòng)態(tài)
- 心理援助熱線(xiàn)即將上線(xiàn),全國(guó)統(tǒng)一電話(huà)“12356”即將在明年5月1日前開(kāi)通,助你走出心理困境
- Anthropic研究發(fā)現(xiàn):打錯(cuò)字可助攻解鎖GPT-4等AI模型秘密
- 小米新車(chē)發(fā)布:YU7亮相,小米注冊(cè)全新商標(biāo),揭秘第二款車(chē)的神秘面紗
- 一汽大眾高層變動(dòng):潘占福"下課",誰(shuí)將接任黨委書(shū)記、總經(jīng)理?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。