原標(biāo)題:AI手機(jī)攝影的三個(gè)流派,其中藏了個(gè)假的
在咱們身邊,有一個(gè)鐵打的定律,那就是一個(gè)東西或者名稱火了,馬上就會群起而模仿之。久而久之,這種“微創(chuàng)新”甚至“不用創(chuàng)新”的方式,被國人冠名為“山寨文化”。
互聯(lián)網(wǎng)領(lǐng)域則更是如此,團(tuán)購火了能百團(tuán)大戰(zhàn),O2O火了能全面“開O”,共享經(jīng)濟(jì)火了,愣是連男友女友都能“共享”。
山寨得多,就連技術(shù)都可以山寨。比如說,去年手機(jī)AI剛剛嶄露頭角,到了今年,全面屏等技術(shù)普及之后,AI似乎就成為了各手機(jī)廠商普遍希望蹭的熱點(diǎn)。
但問題來了,我們知道一塊AI移動芯片要承載非常復(fù)雜的深度架構(gòu),需要幾年來部署開發(fā);下圍棋的AlphaGo要匯集幾十位頂尖科學(xué)家的心血,幾年迭代才能正式超越人類。
代表了機(jī)器智慧向人類接近的AI,難道真的有那么容易嗎?
去年音箱大戰(zhàn)的時(shí)候,有的跟風(fēng)山寨產(chǎn)品甚至隨便搭載個(gè)對話系統(tǒng),連喚醒詞都不換就披掛上陣。雖然對話交互這種形式也可以叫做“AI”,但這樣的產(chǎn)品真的一點(diǎn)價(jià)值都沒有。買到的用戶只能驚呼:遇到個(gè)假的人工智能。
今年,似乎輪到了手機(jī)AI遭遇這種奇遇。各廠商紛紛投入AI懷抱成為流行時(shí),假的AI手機(jī)似乎也悄然來到了我們身邊。
誠然,AI是一個(gè)泛概念,不同等級、不同完成度的技術(shù)孕育其中。但AI也不應(yīng)該是一個(gè)永遠(yuǎn)跌落,毫無底線的技術(shù)。如果沾邊就算的話,茶杯上加個(gè)計(jì)算合適水溫的算法豈不也成了AI設(shè)備——問題是這事人類自己就能感覺出來啊。
所以說,AI的真與假,是建立在能給使用者帶來哪些實(shí)際價(jià)值基礎(chǔ)上的。有無法被其他技術(shù)解決方案替代的價(jià)值,或許才是消費(fèi)者需要的真AI。也只有如此,AI作為一種技術(shù)才能持久。
AI手機(jī)的真與假,或許也應(yīng)該有個(gè)邊界。本尼迪克特·安德森在著名的《想象共同體》中,把極限特征作為框定族群的核心要素。AI手機(jī)帶給消費(fèi)者的價(jià)值,應(yīng)該有哪些底線或者說邊界呢?
今天開始,我們會用幾篇文章,跟大家聊一聊手機(jī)AI背后的真實(shí)、夸張與謊言。攝影、游戲、視頻這些我們耳熟能詳?shù)墓δ鼙澈?,一個(gè)到底什么是真AI手機(jī)的話題正在逐步清晰起來。
而這個(gè)話題首當(dāng)其沖的,當(dāng)然是AI攝影。
我們知道,識別和感知物理世界, 是AI的主要能力。利用AI算法進(jìn)行影像理解,構(gòu)成了AI技術(shù)的核心組成部分之一——機(jī)器視覺。而移植到手機(jī)上,AI與攝像頭結(jié)合,帶來攝影體驗(yàn)改變也就變成了手機(jī)AI的核心價(jià)值。
進(jìn)入2018的春天,AI攝影近乎成為了每一款新上市手機(jī)的關(guān)鍵詞。但其實(shí)AI是一個(gè)非常寬泛的概念,包括林林種種數(shù)十個(gè)技術(shù)體系。
就像同樣是邀請朋友去看“水景”,去馬爾代夫和去小區(qū)健身房看游泳池是絕不一樣的。AI也是如此,耗資巨萬的AlphaGo和成本幾十塊錢的語音交互音箱,可能都可以算到AI的體系,但價(jià)值之差等若霄壤。
在手機(jī)攝影這個(gè)領(lǐng)域也是如此,如何實(shí)現(xiàn)AI,如何讓AI被消費(fèi)者感受到,目前出現(xiàn)了完全不同的一些思路。今天的AI手機(jī)攝影,可以分為三個(gè)流派。
流派一:用芯片提供AI攝影通用加速
去年,華為發(fā)布了搭載NPU的麒麟970芯片開始,之后蘋果也公開了A11仿生神經(jīng)芯片。從后來華為、榮耀的相關(guān)搭載產(chǎn)品,以及蘋果iPhoneX來看,基于AI專用芯片來實(shí)現(xiàn)手機(jī)的AI攝影功能,是這類手機(jī)的核心AI能力。
這可以看做是手機(jī)AI攝影的第一個(gè)流派:芯片派。
華為和榮耀搭載的麒麟970芯片,是世界上首款在CPU、GPU兩個(gè)通用處理單元之外,加入了AI處理單元NPU(Neural network Processing Unit,神經(jīng)網(wǎng)絡(luò)單元)的移動芯片。由于利用了深度學(xué)習(xí)處理技術(shù),NPU可以比其他處理模式更快地處理卷積、遷移等深度學(xué)習(xí)任務(wù),也就可以達(dá)成更快的AI任務(wù)處理能力。根據(jù)數(shù)據(jù)顯示,處理相同的AI任務(wù),麒麟970的異構(gòu)計(jì)算架構(gòu)擁有約 50 倍能效和 25 倍性能的提升,圖像識別速度可達(dá)到約2000張/分鐘,這個(gè)記錄迄今沒有其他芯片打破。
在這之后,蘋果也在發(fā)布iPhone X時(shí)發(fā)布了A11芯片,兩家不約而同采取了相似的策略。A11集成了一個(gè)專用于處理AI任務(wù)的運(yùn)算單元“神經(jīng)網(wǎng)絡(luò)引擎(Neural Engine)”,開啟了iPhoneX的AI之路。
從底層芯片開始一層層疊加AI處理能力。有兩個(gè)層面的價(jià)值,一是在硬件里完成終端AI計(jì)算,可以保證攝像任務(wù)的實(shí)時(shí)性和安全性。畢竟攝影任務(wù)上傳到云端計(jì)算有卡頓可能,斷網(wǎng)后無法工作,圖片上傳服務(wù)器面臨的數(shù)據(jù)危險(xiǎn)也是顯而易見的。
另一方面,芯片派容易被忽略的價(jià)值在于對AI攝影任務(wù)進(jìn)行通用加速。比如有的玩法要人臉識別,有的直播要讀取動作指令,有的濾鏡要搞空間處理,把這些全擠在CPU、GPU上手機(jī)馬上會進(jìn)入龜速狀態(tài),用云處理無法支持不說,更喪失了實(shí)時(shí)體驗(yàn)。APP的攝影需求有千千萬,目前來看只有在終端有AI處理單元才能滿足這些“未知需求”。
說到底,基于芯片的AI攝影到底有哪些體驗(yàn)?zāi)兀?/p>
華為Mate10、榮耀V10以及iPhone X的能力數(shù)據(jù)說明,AI攝影可以體現(xiàn)在識別、動作捕捉、光影分析、AR等幾個(gè)方面。
比如iPhoneX利用A11仿生芯片,可以與結(jié)構(gòu)光傳感器、深度陀螺儀進(jìn)行結(jié)合,處理人臉、AR等任務(wù),并可以快速處理圖像識別。
而借助麒麟970芯片帶來的NPU專項(xiàng)處理能力,榮耀V10、華為mate10等產(chǎn)品可以實(shí)現(xiàn)復(fù)雜的AI任務(wù)加速,從而完成場景識別拍照模式、圖像增強(qiáng)與深度處理、AI肖像處理、AI動態(tài)捕捉、AI夜拍等任務(wù)。包括當(dāng)下較為少見的圖像語義分割功能,通過強(qiáng)計(jì)算能力實(shí)現(xiàn)對取景器內(nèi)的畫面進(jìn)行分割處理,進(jìn)一步實(shí)現(xiàn)精準(zhǔn)的智慧分區(qū)圖像處理,相較圖像處理App更接近修圖師的專業(yè)效果。
接下來,榮耀、華為的新產(chǎn)品,以及新一代iPhone必然會繼續(xù)這條路。而產(chǎn)品和技術(shù)先發(fā)優(yōu)勢,似乎也在催生AI體驗(yàn)的升級。比如榮耀最早從magic時(shí)代就開始積累AI手機(jī)的產(chǎn)品經(jīng)驗(yàn)與訓(xùn)練數(shù)據(jù),兩年的時(shí)間自然形成了對新產(chǎn)品的供養(yǎng)體系。
這個(gè)流派的優(yōu)點(diǎn)在于,用戶可以體驗(yàn)到AI的多樣化和增長性,手機(jī)里不是一成不變的AI體驗(yàn),而是可以隨著生態(tài)和技術(shù)的發(fā)展不斷進(jìn)化。問題是芯片流的門檻很高,需要研發(fā)的巨大投入和長達(dá)幾年的等待周期。
流派二:基于攝像頭搞AI
第二個(gè)AI手機(jī)攝影流派,不能不提到讓人愛恨糾葛的谷歌。
眾所周知,谷歌是不大力押注硬件技術(shù)的,而是在戰(zhàn)略上選擇強(qiáng)打AI算法優(yōu)勢和云計(jì)算強(qiáng)項(xiàng)。這個(gè)被谷歌稱為AI First的戰(zhàn)略,已經(jīng)體現(xiàn)在谷歌各種穿戴、家庭以及移動設(shè)備上,其中pixel系列手機(jī)也不例外。
去年推出的谷歌pixel 2,給出了一個(gè)非常特別的AI攝影模式,它沒有專屬的AI芯片,卻利用算法和AI圖像處理單元完成了動態(tài)模糊攝影等攝影能力的補(bǔ)償。甚至把攝像頭切割成非常復(fù)雜的成像單元,來供給算法端實(shí)現(xiàn)對景深、空間感的AI計(jì)算。
這種“吃力不討好”的方式,大概也只有谷歌會做。背后的核心原因,一方面是谷歌希望用戶適應(yīng)所有數(shù)據(jù)都上傳到谷歌云的生活方式,另一方面也是希望加強(qiáng)AI優(yōu)勢的商業(yè)化通道。
谷歌手機(jī)的AI秘訣,不在底層芯片里,而是在攝像頭區(qū)域里藏了一顆專用圖像處理協(xié)處理器,即ImageProcessing Unit (IPU),專門用來結(jié)合云計(jì)算與算法集群處理AI拍照與視頻任務(wù)。
但這樣做的問題是圖像任務(wù)會在專門的部件里處理,并且極大程度依賴云計(jì)算。但確實(shí)一定程度上繞開了開發(fā)芯片的難度,彌補(bǔ)了谷歌硬件上的弱勢。這種劍走偏鋒,讓手機(jī)各部件自行AI的思路,有賴于谷歌強(qiáng)絕天下的算法積累,以及云計(jì)算處理能力。缺點(diǎn)是:除了谷歌大概沒有人可以嘗試。
流派三:搞個(gè)帶算法的APP算了
在手機(jī)AI概念火熱起來之后,國內(nèi)手機(jī)廠商似乎很快就按耐不住了。雨后春筍版的“AI攝影”字樣應(yīng)運(yùn)而生,于是也催生了AI攝影的第三個(gè)流派:APP派。
所謂APP派很好理解,想一想我們用的各種美顏拍照相機(jī)、動態(tài)美顏錄制應(yīng)用等等,這些能力,在今天基本都要用到AI算法來實(shí)現(xiàn)更好的效果。比如美圖秀秀旗下的美圖相機(jī),就是在APP里集成了機(jī)器學(xué)習(xí)算法,用來識別拍攝人像和背景、光源間的關(guān)系,從而把人像分離出來。
假如把這種基于算法的“AI應(yīng)用”或者“AI濾鏡”,直接搭載到產(chǎn)品攝像頭里,說這是AI攝影功能,行不行呢?
好像,大概,可能,也可以吧?
問題是缺少芯片的支持,算法方面也沒有技術(shù)優(yōu)勢,用戶拿到的AI體驗(yàn)可能存疑。
前不久,紅米Note5主打了所謂“千元AI雙攝”打開了這場關(guān)于AI的宣傳戰(zhàn)序幕。隨后vivo X21也以AI攝影能力作為宣傳。從產(chǎn)品說明中可見,這兩部手機(jī)的解決方案基本就是上文所說的“AI濾鏡”模式:開發(fā)具有一定識別特性的攝影功能,然后在不卡的前提下部署在手機(jī)中就可以了。
剛剛發(fā)布的小米Mix2S,本質(zhì)上也是這種解決方案。小米提出的智能場景識別,即在利用圖像數(shù)據(jù)訓(xùn)練處手機(jī)對不同景物的識別能力,再在手機(jī)相機(jī)中初始化搭載“美圖相機(jī)”之類APP的算法功能,針對不同拍照對象進(jìn)行針對性修圖。
比如機(jī)器學(xué)習(xí)進(jìn)行人臉和人體輪廓識別,自動進(jìn)行背景虛化和摳圖,以及自動疊加多張照片進(jìn)行防抖等等。
這類手機(jī)的問題,在于芯片和攝像頭中缺乏專項(xiàng)處理AI任務(wù)的單元,一旦運(yùn)行高負(fù)載的AI任務(wù)就需要呼喚云端。而云端的相應(yīng)速度不夠,又導(dǎo)致AI攝影的識別率和準(zhǔn)確率下降。
舉個(gè)例子,處理夜拍效果時(shí),手機(jī)需要運(yùn)用光源捕捉、空間捕捉等AI算法,從而實(shí)現(xiàn)夜晚中清晰拍照和光源還原。
而這類APP派假如要加載夜拍類的AI應(yīng)用就有點(diǎn)尷尬了。因?yàn)檫@類深度學(xué)習(xí)的負(fù)載很大,用傳統(tǒng)移動芯片+云計(jì)算來跑這類AI拍攝任務(wù),會出現(xiàn)黑夜一層層褪去,半天無法對焦。拍照之后又要上傳到云端進(jìn)行很長時(shí)間“處理”,精準(zhǔn)度和體驗(yàn)都很差。而一旦沒網(wǎng)就更麻煩了。所以我們能看到的是,目前大部分國產(chǎn)手機(jī)宣傳所謂的AI拍照時(shí),都絕口不提夜拍、動作捕捉等復(fù)雜任務(wù)。
于是,這個(gè)流派中消費(fèi)者看到的宣傳材料里的“AI拍照”,也就變成了整個(gè)手機(jī)的全部AI能力。其實(shí)這些能力弄個(gè)不算太差的手機(jī)下載個(gè)相關(guān)APP就可以實(shí)現(xiàn)了,單獨(dú)作為一款產(chǎn)品的主要宣傳材料就有點(diǎn)奇怪。
最后,讓我們總結(jié)一下三個(gè)流派的手機(jī)AI攝影,到底帶給消費(fèi)者怎樣的差別。
芯片派:可以通過終端AI加速,來實(shí)現(xiàn)比較高等級的AI攝影任務(wù),比如快速美化、物體識別方案拍照等等。而且通用加速能力和平臺接口下放給開發(fā)者,更多的拍照應(yīng)用,比如夜拍、動作抓拍、人臉替換、體態(tài)命令等等,必然會陸續(xù)加入到用戶的手機(jī)中。用戶相當(dāng)于購買了持續(xù)升級的AI拍照設(shè)備。
攝像頭派:基于攝像頭的AI芯片,應(yīng)該可以加入更多AI玩法,但是除了谷歌之外,其他開發(fā)者是絕對碰不到的。
APP派:抱歉,除了廣告語上的1~2個(gè)基礎(chǔ)AI功能外,別的就不用想了。
三個(gè)流派背后手機(jī)AI的孰真孰假,也就一目了然了。接下來一篇,我們會聊聊手機(jī)游戲上的真假AI。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。