凱文·凱利曾說,未來20年最偉大的事情可能還沒有出現(xiàn),但可以預測的是,人工智能將是未來20年內最重要的技術趨勢,創(chuàng)業(yè)企業(yè)的方向應該很明確,就是將人工智能應用于某個領域。
近兩年,人工智能創(chuàng)業(yè)公司如雨后春筍一般不斷涌現(xiàn),但是大部分的企業(yè)是關注于如何讓自家的產品更加智能,但有這么一家公司卻立下 flag,要做商品識別領域的人工智能賦能者,讓別人的產品更加智能。
AI,這家公司要做商品識別領域的 AI 賦能者" />
Matt Scott
在2017年北京GMIC大會期間,碼隆科技聯(lián)合創(chuàng)始人兼 CTO 碼特(Matt Scott)告訴雷鋒網,和其他人工智能公司不同,碼隆科技是將商品識別方面的技術開放給其他企業(yè),使得他們能夠運用這些技術去搭建屬于自己的商品識別引擎。
而碼特提及的人工智能技術,碼隆科技已將其搭建成一個人工智能平臺—ProductAI。
什么是ProductAI 平臺?
商品識別
在弄清楚 ProductAI 平臺之前,需要先介紹一下商品識別的概念。碼特告訴雷鋒網,大家都熟悉人臉識別,通過人工智能分類技術可以提取出如性別、年齡、種族等信息,那么商品識別也類似,拿時尚領域來說,通過人工智能技術可以提取出服飾的材質、色彩、風格等特征。
但是區(qū)別之處在于,商品里既包含酒瓶、車輛、家具這樣的剛性物體,也包含服飾面料等易折疊的柔性物體。除了易褶皺這樣的屬性,柔性物體上的面料紋路和圖案也不盡相同,所以相對介于剛性和柔性之間的人臉,柔性物體的識別難度更大,而這個也正是碼隆科技投入大量精力去鉆研并且擅長的領域,碼特說。
ProductAI 的登錄界面
ProductAI
碼特告訴雷鋒網,商品識別技術的背后需要有海量商品數(shù)據(jù)的支持,通過收集針對某些垂直行業(yè)的商品圖像數(shù)據(jù),運用適用于這個行業(yè)的算法去搭建這些垂直領域的模型,由此產生針對垂直領域的商品識別結果,如:分類(Classification)、檢測(Detection)、分割(Segmentation)、檢索(Retrieval)等等。
企業(yè)能夠運用這些功能去搭建他們自己的商品識別服務,而碼隆則將上述提供的服務進行整合,搭建成一個人工智能平臺—ProductAI。也就是說,ProductAI是企業(yè)運用人工智能商品識別服務的入口。
ProductAI的核心技術服務
據(jù)碼特介紹,針對垂直領域,ProductAI有兩大核心技術服務:
垂直領域圖像檢索(Vertical AI Image Retrieval)
垂直領域自動標注(Vertical Auto-Tagging)
垂直領域商品檢索服務
在圖像檢索方面,除了上文中提到的碼隆擅長的時尚、紡織面料等領域,碼特告訴雷鋒網,現(xiàn)在又新增了在車輛、酒類、家具等垂直領域的模型,未來還將持續(xù)擴充人工智能在商品識別的垂直場景。
在擴充了使用場景后,問題也隨之而來:這個橫跨多領域的智能識別系統(tǒng),如何能保證其既能實時處理上億數(shù)據(jù),又能處理不同類別的調用請求? 還能保證高性價比?對此,碼特分享了碼隆的做法:
第一點:我們首次提出“場景選擇” (Scenario Selection)的概念,用戶可在圖像檢索服務中,選擇所屬行業(yè)的場景服務,然后運用到自己的產品中,以獲得最好的性能。提到圖像檢索服務,人們會想到谷歌和百度的以圖搜圖功能,但是他們大多使用的是通用模型,相較于我們使用垂直領域專用語言(Domain Specific Language)進行搜索引擎搭建,通用模型的商品檢索精確度往往差強人意。
第二點:算法。除了擁有億級以上的垂直行業(yè)圖像數(shù)據(jù)以外,在每個垂直行業(yè)的基礎上,我們使用了多任務的深度度量學習(Deep Metric Learning)來訓練端到端的圖像檢索模型,這使得我們相較于其他人工智能公司,在商品識別方面,特別是難度最大的柔性商品識別領域,能夠獲得更加精確的檢索結果。
關于精確度的考量,可以說碼隆現(xiàn)已在業(yè)內遙遙領先,而且我們有信心與 CVPR, ICCV, ECCV 等國際頂尖論文的公開基準點(Public Benchmarks)進行比較。
第三點:速度。我們花費了非常多的精力將二值神經網絡和分布計算的技術運用在深度學習網絡當中,以實現(xiàn)大規(guī)模且高效率的查詢檢索。
第四點:費用。我們一直在努力降低服務成本,以便讓更多企業(yè)能夠受益于這項服務。
垂直領域的商品圖像自動標注服務
如上圖所示,除了商品檢索之外,ProductAI 的圖像識別技術還能對圖片進行實體檢測,定位圖中實體,同時提供可定制的標注信息,碼特告訴雷鋒網。
說起圖像標注,碼特說,讓我們來聊一個當下比較熱的話題:如何提升訓練數(shù)據(jù)的效率?
對于人工智能公司而言,想要獲取到海量的有標注數(shù)據(jù)難度是比較大的,我們內部有專門的團隊負責這部分的信息收集,從而提供數(shù)以百萬計的標注數(shù)據(jù),目前做得很不錯。
這個就是業(yè)界普遍在做的監(jiān)督學習,但我們同時也正在往半監(jiān)督學習(Semi-supervise Learning) 的階段前進,生成對抗網絡GAN(Generative Adversarial Networks)就是一種很好的方法。
有了生成對抗網絡,我們就可以不需要像過去那么多高質量的標簽數(shù)據(jù),而是通過一些技術去獲取這些數(shù)據(jù)。在以一定數(shù)量的標注數(shù)據(jù)作為訓練基礎的情況下,將這些技術應用于訓練分割、檢測、分類、圖像檢索這些任務,從而減輕訓練海量標注數(shù)據(jù)的負擔。
有哪些實際的應用?
以圖搜圖
1、布料搜索
顧名思義,通過在 ProductAI 平臺上建立的 “以圖搜布” 面料商品圖像搜索引擎,人們只需要對著想要購買的面料拍攝一張照片,系統(tǒng)會先識別出面料的圖形與花色,然后生成相應的購買鏈接。碼特說道,這個案例是 ProductAI 的第一個應用,目前中國前 10 大紡織面料企業(yè),有 7 家已經接入了這個服務。
圖像搜索引擎有非常廣闊的行業(yè)應用空間,尤其針對一些難以用語言描述的場景,比如布料的花紋和質地,用視覺方式檢索就會很直接。碼特補充道。
2、時尚商品搜索
只要將服裝網站上的喜歡的款式截圖,復制粘貼到基于 ProductAI 的圖像搜索引擎上,便可以迅速得到服裝的批發(fā)購買鏈接。即使服裝商品圖片經過PS、翻轉、變形,即使有些相同衣服的模特不同,也能夠搜索出來。同時,同樣款式的衣服可以一起被搜索出來,供消費者進行比價挑選。
時尚分析與趨勢預測
作為面料紡織行業(yè)權威機構,中國紡織信息中心需要預測流行色等未來的趨勢,再把預測信息和整個產業(yè)進行分享,起到引領風潮的作用。通過自動抽取海量T臺圖像信息中的主體色彩,ProductAI 能夠在短時間內完成顏色分析,總結出整體趨勢,減少了人力觀測成本,碼特說。
出版物識別
ProductAI 還可以提供出版物識別技術,一個典型的例子是《光明日報》在嵌入人工智能識別技術后,只要對著報紙拍一張照片,便可實時識別出與之相關聯(lián)的全媒體信息,如視頻等,搭建起了虛擬與現(xiàn)實的橋梁。
碼隆科技創(chuàng)業(yè)路線
2014年7月,黃鼎隆與曾經微軟的同事Matt Scott(碼特) 聯(lián)合創(chuàng)立了碼隆科技,可以看出公司的名稱就是兩位創(chuàng)業(yè)者名字的結合。
2015年1月,碼隆科技入選微軟創(chuàng)投加速器。同時推出了面向C端的以圖搜圖的移動應用StyleAI,希望用圖像識別結合深度學習來破解時尚密碼。
2015年3月,達晨創(chuàng)投和遠鏡創(chuàng)投共同為碼隆科技注入1200萬元天使投資。
2016年7月,碼隆科技完成了6200萬人民幣的A輪融資。
2016年10月,碼隆科技正式發(fā)布人工智能視覺應用平臺—ProductAI 。
對中美人工智能發(fā)展的看法
作為一個在中國創(chuàng)業(yè)的美國人,碼特擁有 40 多項中美專利、發(fā)表了 13 篇國際頂級論文,有著十多年的開發(fā)經驗和微軟亞洲研究院高級研發(fā)主管的工作經歷,所以談及中美在人工智能方面學術與商業(yè)化的話題,他感觸頗深:
就學術研究而言,根據(jù)2016年美國白宮發(fā)表的人工智能戰(zhàn)略報告,自2014年起,中國在人工智能領域所發(fā)表的論文與期刊數(shù)量,及被引用文章數(shù)皆已位居世界之首。中國近幾年在人工智能領域的研究發(fā)展已超越美國,成為世界領先的代表。
商業(yè)化方面,因為中國更大、人更多、企業(yè)也更多,同時中國專注于某些美國不會重點關注的領域,如:制造業(yè)、硬件等。在中國,人工智能更有機會在垂直行業(yè)中發(fā)揮更大的影響力。當人工智能遇上攝像頭這類的硬件產品,會發(fā)揮巨大的價值。而當人工智能助力制造業(yè)時,對全世界都能夠帶來更大的影響力。舉例來說在中國深圳,這個制造業(yè)之鄉(xiāng),機器人產業(yè)最為繁榮的中國城市,現(xiàn)階段達到如此巨大規(guī)模的發(fā)展,放眼世界,只有在中國才可能發(fā)生。
當雷鋒網(公眾號:雷鋒網)問及碼隆下一步的計劃時,碼特的回答簡潔而有力,我們希望能夠在垂直領域做得更加深入,并進軍國際市場。
凱文·凱利曾說,未來20年最偉大的事情可能還沒有出現(xiàn),但可以預測的是,人工智能將是未來20年內最重要的技術趨勢,創(chuàng)業(yè)企業(yè)的方向應該很明確,就是將人工智能應用于某個領域。
近兩年,人工智能創(chuàng)業(yè)公司如雨后春筍一般不斷涌現(xiàn),但是大部分的企業(yè)是關注于如何讓自家的產品更加智能,但有這么一家公司卻立下 flag,要做商品識別領域的人工智能賦能者,讓別人的產品更加智能。
Matt Scott
在2017年北京GMIC大會期間,碼隆科技聯(lián)合創(chuàng)始人兼 CTO 碼特(Matt Scott)告訴雷鋒網,和其他人工智能公司不同,碼隆科技是將商品識別方面的技術開放給其他企業(yè),使得他們能夠運用這些技術去搭建屬于自己的商品識別引擎。
而碼特提及的人工智能技術,碼隆科技已將其搭建成一個人工智能平臺—ProductAI。
什么是ProductAI 平臺?
商品識別
在弄清楚 ProductAI 平臺之前,需要先介紹一下商品識別的概念。碼特告訴雷鋒網,大家都熟悉人臉識別,通過人工智能分類技術可以提取出如性別、年齡、種族等信息,那么商品識別也類似,拿時尚領域來說,通過人工智能技術可以提取出服飾的材質、色彩、風格等特征。
但是區(qū)別之處在于,商品里既包含酒瓶、車輛、家具這樣的剛性物體,也包含服飾面料等易折疊的柔性物體。除了易褶皺這樣的屬性,柔性物體上的面料紋路和圖案也不盡相同,所以相對介于剛性和柔性之間的人臉,柔性物體的識別難度更大,而這個也正是碼隆科技投入大量精力去鉆研并且擅長的領域,碼特說。
ProductAI 的登錄界面
ProductAI
碼特告訴雷鋒網,商品識別技術的背后需要有海量商品數(shù)據(jù)的支持,通過收集針對某些垂直行業(yè)的商品圖像數(shù)據(jù),運用適用于這個行業(yè)的算法去搭建這些垂直領域的模型,由此產生針對垂直領域的商品識別結果,如:分類(Classification)、檢測(Detection)、分割(Segmentation)、檢索(Retrieval)等等。
企業(yè)能夠運用這些功能去搭建他們自己的商品識別服務,而碼隆則將上述提供的服務進行整合,搭建成一個人工智能平臺—ProductAI。也就是說,ProductAI是企業(yè)運用人工智能商品識別服務的入口。
ProductAI的核心技術服務
據(jù)碼特介紹,針對垂直領域,ProductAI有兩大核心技術服務:
垂直領域圖像檢索(Vertical AI Image Retrieval)
垂直領域自動標注(Vertical Auto-Tagging)
垂直領域商品檢索服務
在圖像檢索方面,除了上文中提到的碼隆擅長的時尚、紡織面料等領域,碼特告訴雷鋒網,現(xiàn)在又新增了在車輛、酒類、家具等垂直領域的模型,未來還將持續(xù)擴充人工智能在商品識別的垂直場景。
在擴充了使用場景后,問題也隨之而來:這個橫跨多領域的智能識別系統(tǒng),如何能保證其既能實時處理上億數(shù)據(jù),又能處理不同類別的調用請求? 還能保證高性價比?對此,碼特分享了碼隆的做法:
第一點:我們首次提出“場景選擇” (Scenario Selection)的概念,用戶可在圖像檢索服務中,選擇所屬行業(yè)的場景服務,然后運用到自己的產品中,以獲得最好的性能。提到圖像檢索服務,人們會想到谷歌和百度的以圖搜圖功能,但是他們大多使用的是通用模型,相較于我們使用垂直領域專用語言(Domain Specific Language)進行搜索引擎搭建,通用模型的商品檢索精確度往往差強人意。
第二點:算法。除了擁有億級以上的垂直行業(yè)圖像數(shù)據(jù)以外,在每個垂直行業(yè)的基礎上,我們使用了多任務的深度度量學習(Deep Metric Learning)來訓練端到端的圖像檢索模型,這使得我們相較于其他人工智能公司,在商品識別方面,特別是難度最大的柔性商品識別領域,能夠獲得更加精確的檢索結果。
關于精確度的考量,可以說碼隆現(xiàn)已在業(yè)內遙遙領先,而且我們有信心與 CVPR, ICCV, ECCV 等國際頂尖論文的公開基準點(Public Benchmarks)進行比較。
第三點:速度。我們花費了非常多的精力將二值神經網絡和分布計算的技術運用在深度學習網絡當中,以實現(xiàn)大規(guī)模且高效率的查詢檢索。
第四點:費用。我們一直在努力降低服務成本,以便讓更多企業(yè)能夠受益于這項服務。
垂直領域的商品圖像自動標注服務
如上圖所示,除了商品檢索之外,ProductAI 的圖像識別技術還能對圖片進行實體檢測,定位圖中實體,同時提供可定制的標注信息,碼特告訴雷鋒網。
說起圖像標注,碼特說,讓我們來聊一個當下比較熱的話題:如何提升訓練數(shù)據(jù)的效率?
- 華為家庭存儲升級鴻蒙 HarmonyOS 4.2.0.39:優(yōu)化協(xié)同操作邏輯,帶來更流暢的使用體驗
- 海信CES2025黑科技突破:液晶電視首發(fā)彩色光源
- TCL創(chuàng)新設計Playcube投影儀:立方體旋轉設計,便攜內置電池,打破傳統(tǒng)投影限制
- 華為小豚當家室外攝像頭升級版:WiFi+網線雙連接,800萬像素真實監(jiān)控,329元超值體驗
- LG新款便攜式電視StanbyME 2:輕裝出行,時尚新選擇
- 五軸折疊仿生機械手,石頭 G30 Space 探索版自清潔掃地機器人顛覆傳統(tǒng),開啟家居清潔新篇章
- 石頭G30掃地機器人:避障能力強悍、底盤升降黑科技,真實體驗顛覆想象,僅售5499元
- 小米人車家全生態(tài)引領未來,高通驍龍跨端互聯(lián)生態(tài)重塑智能生活
- 貴金屬智能戒指追蹤心率,價格高達1500英鎊,你還愿意戴上它嗎?
- 海外新秀閃極子品牌loomos AI眼鏡:低調奢華,揭開GPT-4o神秘面紗
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。