大多數(shù)人懶得給照片加標簽。如果你屬于這一類(大概率事件),那么你一定知道搜索某張照片有多辛苦。 但這很有可能即將成為過去。
本周,F(xiàn)acebook 披露了其機器學(xué)習(xí)平臺 Lumos 的更多信息:Lumos 將使用戶們利用相片內(nèi)容進行搜索,而不是圖片名稱或是標簽。
Facebook 應(yīng)用機器學(xué)習(xí)負責(zé)人 Joaquin Quiñonero Candela 解釋說:
“換句話說,搜索‘黑襯衫照片‘時,系統(tǒng)能識別出每張照片里是否有黑襯衫,并據(jù)此搜索;即便照片并沒有被添加標簽也沒有關(guān)系。”
Lumos 利用了計算機視覺技術(shù)來識別照片中的人、動物和一系列其他物體。但它遠不止于此,而是更進一大步,能識別出照片中發(fā)生的“事”。所以在識別某相片中有某個人之外,它還能夠判斷該人是在行走、騎馬、彈琴還是在做其他的事情。雷鋒網(wǎng)按,F(xiàn)acebook 并沒有提供一張 Lumos 所能識別的人物行為列表,因此目前并不清楚它究竟神通廣大到了何種地步,以及識別的正確率如何,會不會犯下“妖精打架”那樣的錯誤。假使正確率尚在接受范圍以內(nèi),相比目前各照片管理軟件還停留于人臉識別的層次(除了 Google Photos),便是極大的進步,其技術(shù)可能成為Google Photos 的直接競爭對手。
Lumos,一個計算機視覺平臺
介紹 Lumos,就不得不提 FBLearner Flow。Facebook 使用了它的 FBLearner Flow 平臺來開發(fā) Lumos。前者是一個通用型的機器學(xué)習(xí)流水線(pipeline),開發(fā)它的初衷是讓 Facebook 工程師們能同時執(zhí)行多個 AI 項目,而不需要每次都借助必要的硬件。據(jù) Facebook 透露,現(xiàn)在每月有超過 120 萬個 AI 實驗在 FBLearner Flow 上運行。包括 Lumos 在內(nèi)的這些項目,能夠獲取社交網(wǎng)絡(luò)和 app 上永不停歇的數(shù)據(jù)流。
雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))獲知,一開始,F(xiàn)BLearner Flow 平臺只是 Facebook AI 研究部門(FAIR)的一個小研究項目。但當(dāng)它達到量產(chǎn)規(guī)模后,它和開發(fā)團隊被轉(zhuǎn)移到了應(yīng)用機器學(xué)習(xí)團隊?,F(xiàn)在,F(xiàn)BLearner Flow 已是 Facebook 計算機視覺團隊的引擎。
建立在 FBLearner Flow 基礎(chǔ)上的 Lumos,是一個 Facebook 為處理圖像和視頻理解任務(wù)而開發(fā)的平臺。Facebook 的工程師并不需要接受過深度學(xué)習(xí)或者計算機視覺培訓(xùn),就能使用 Lumos 訓(xùn)練、布置新模型。Lumos 平臺在不斷改進,這主要有兩種途徑:
導(dǎo)入新添加標記的數(shù)據(jù);
利用 Facebook 應(yīng)用中有注解的數(shù)據(jù)。
深度學(xué)習(xí)的進步使得開發(fā)者在圖像分類上取得巨大進展——類似于“圖片中有什么”、“東西在哪?”這樣的問題被系統(tǒng)以前所未有的精確度回答出來。 Facebook 表示,通過設(shè)計出能對給定圖片中的物體進行檢測、分離的新技術(shù),他們大幅推動了在該領(lǐng)域的研究。
當(dāng) Facebook 應(yīng)用這些技術(shù)時,相片會穿過一個深度學(xué)習(xí)引擎,后者能分離圖像、識別物體和場景、向照片加入更多含義。這產(chǎn)生出任何 Facebook 產(chǎn)品、服務(wù)都能使用的豐富數(shù)據(jù)。
前景
Joaquin Quiñonero Candela 還表示,Lumos 涵蓋的技術(shù)有一系列廣闊的應(yīng)用場景,遠不止于單純地優(yōu)化圖像搜索。他進一步解釋:
“出于‘爭議內(nèi)容檢測,反垃圾信息和自動圖像抓取’等目的,已經(jīng)有超過 200 個視覺模型被十幾只不同團隊訓(xùn)練出來,并布置于 Lumos。它們的應(yīng)用領(lǐng)域十分廣,從我們的 Connectivity Labs (互聯(lián)實驗室)到搜索團隊,再到 Accessibility (可達性)團隊,大家都在用 Lumos 的技術(shù)。”
雖然 Facebook 在 Lumos 上取得可喜進展,但它還稱不上是獨步天下。谷歌一直在開發(fā)圖像掃描 AI 來提高圖像搜索。去年,谷歌聲稱它的 Inception v3 AI 能夠以 93.9% 的精確度抓取圖片內(nèi)容。雷鋒網(wǎng)消息,最近 Inception v3 又有突破:在它基礎(chǔ)之上將開發(fā)能預(yù)警皮膚癌的新 AI。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- ?5年投入200億打造飛行汽車!?長安汽車布局萬億“低空”市場
- 英偉達涉嫌違反反壟斷法 市場監(jiān)管總局依法決定立案調(diào)查
- 上海敲定5G-A發(fā)展目標:到2026年發(fā)展500萬用戶,建設(shè)3.2萬個3CC基站
- 中國電信注資10億成立天通衛(wèi)星科技公司,將推動衛(wèi)星通信手機向3000元下探
- 上汽今年銷量或會被比亞迪反超,痛失18年“中國車企銷量冠軍”
- 英特爾CEO基辛格名為退休,實為被董事會趕下臺?
- 華為申請多枚鴻蒙辦公商標,涉及辦公用品等多個領(lǐng)域
- “數(shù)智化”登頂《咬文嚼字》十大流行語,數(shù)智技術(shù)應(yīng)用深入人心
- IDC預(yù)計:2028年AI基礎(chǔ)設(shè)施支出將超1000億美元
- 韓系動力電池裝機量下挫,三大廠商市占率降至17.2%,落后寧王比亞迪
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。