9月16日,蘋果秋季新品發(fā)布會如約而至,但傳聞中的iPhone12卻要等到下個月才能見到。發(fā)布會僅上新了兩款智能手表和兩款iPad平板電腦,新品iPad Air 4則搭載了最新的處理器芯片A14 Bionic(仿生)處理器。這幾款新產(chǎn)品香不香另說,A14 Bionic處理器卻成為了此次發(fā)布會的最大亮點。
根據(jù)蘋果的介紹,A14 Bionic處理器是蘋果首款采用5nm工藝打造移動設(shè)備芯片,晶體管數(shù)量相較于A13 Bionic處理器的7nm芯片增加了近40%,晶體管數(shù)量達到了驚人的118億顆。
僅憑工藝制程的提升,A14在性能和功耗表現(xiàn)上自然會有一定的提升。官方宣稱,在性能比較上,CPU提升40%,全新GPU構(gòu)架提升30%。不過,讓外界吐槽的是,這一數(shù)據(jù)是A14跟A12比較得出來的。這讓A13情何以堪呢?
而根據(jù)蘋果之前公布的數(shù)據(jù),A13相比A12在CPU和GPU性能上都提高了20%。因此,如果這兩代的處理器性能指標測量標準一致的話,則A14的CUP性能僅比A13快了約16%,GPU性能僅比A13提升了約8.3%。可以說,如果排除掉5nm工藝本身所帶來的改進,相對A13來說,A14在CPU和GPU核心本身性能上的提升其實并不高。
不過,在AI算力上,A14相比A13則有了非常大的提升,從之前的8核NPU直接翻倍提升到16核NPU。根據(jù)蘋果的測試,A14的AI運算能力也提升到了11.8萬億次,機器學習速度提升了70%,機器學習加速器則令運算速度快達10倍,將各種機器學習應(yīng)用的性能表現(xiàn)提升至全新水平。
如果留意就會發(fā)現(xiàn),蘋果從A11到A14,每一次在AI運算性能上都做了大幅地提升。盡管我們看到蘋果并不總是以AI芯片或者AI智能終端為噱頭來做宣傳,但事實上蘋果iOS系統(tǒng)上已經(jīng)遍布各種AI應(yīng)用或者功能,對AI算力增長提出了超高的需求;與此同時,安卓陣營高端芯片廠商在AI芯片上面的頻頻發(fā)力,正在縮短甚至追上與蘋果的A系列芯片的差距,這些可能都是構(gòu)成蘋果移動終端芯片的AI算力爆發(fā)式增長的緣由。
從A11到A14,蘋果的AI算力進化
2017年,AI已經(jīng)成為大眾熱議的話題。此時沒有一家終端芯片廠商不是以AI作為產(chǎn)品的新噱頭,但真正能在AI芯片方面拿得出手的廠商也沒有幾家。這一年華為的麒麟970橫空出世,搶到了首發(fā)。10天后,蘋果的A11 Bionic也正式發(fā)布,A11采用10nm工藝制程、六核CPU、自研三核心GPU設(shè)計。
之所以可以稱為“AI芯片”,就在于A11首次搭載神經(jīng)網(wǎng)絡(luò)引擎處理器單元(Neural Network Processing Unit,NPU),并且在新的神經(jīng)網(wǎng)絡(luò)引擎上蘋果發(fā)布了第一代Core ML,運用本地化人工智能加速器進行機器學習。
A11搭載的NPU采用雙核設(shè)計,每秒運算次數(shù)6000億次,主要處理機器學習任務(wù),能夠識別人物,地點和物體,主要針對的應(yīng)用是iPhone新推出的人臉識別鎖屏FaceID以及人臉關(guān)鍵點追蹤Animoji,且NPU算力并不對第三方應(yīng)用開放。
蘋果A11處理器的標志意義,除了成為蘋果自主研發(fā)程度最高的一代處理器之外,其實也和華為一起真正地打開了移動終端的AI時代。此后幾乎所有手機廠商都把AI運算能力當作宣傳賣點和升級點。
蘋果在2018年推出的A12 Bionic,采用了臺積電當時最新的7nm工藝制程,蘋果自研的Fusion架構(gòu),而神經(jīng)網(wǎng)絡(luò)引擎從雙核直接升級到八核,能夠?qū)崿F(xiàn)每秒5萬億次計算,比較上一代有了8.3倍的提升。第二代神經(jīng)網(wǎng)絡(luò)引擎才是在算力和性能上能夠?qū)崿F(xiàn)更多AI功能。另外,A12采用了全新的智能HDR算法以及core ML帶來的圖像識別、第三方APP垃圾信息處理等功能,AI應(yīng)用開始普及。
2019年發(fā)布的A13 Bionic處理器,CPU、GPU和NPU的核心數(shù)都與A12相同,只是采用了臺積電升級版7nm工藝,集成85億個晶體管,性能、功耗都有了一定提升,而神經(jīng)網(wǎng)絡(luò)引擎的峰值算力提升到每秒6萬億次計算,提升幅度并不顯著,同樣是為面容ID、三攝系統(tǒng)、AR類APP等機器學習應(yīng)用提供算力支持。不過值得一提的是,通過在CPU中加入2個機器學習加速器,讓CPU可以達到每秒1萬億次的矩陣數(shù)學運算。同時,Core ML3可以與機器學習控制器配合,自動為CPU、GPU和NPU分配任務(wù)。
這次發(fā)布的A14處理器芯片上,神經(jīng)引擎核心數(shù)再次翻倍達到16個,每秒運算次數(shù)達到了驚人的11.8萬億次,機器學習速度提升了70%,機器學習加速器則令運算速度快達10倍,將各種機器學習應(yīng)用的性能表現(xiàn)再次大幅提升。
AI應(yīng)用的“猛虎”,蘋果AI芯片大規(guī)模升級的內(nèi)因
根據(jù)資料,早在2014年,蘋果已經(jīng)在新一代架構(gòu)芯片Soc的開發(fā)中加入專門的AI芯片。而在此之前,蘋果的AI算力是由“CPU+GPU”實現(xiàn),其自主開發(fā)AI芯片的設(shè)計思路則是由CPU和GPU處理的AI任務(wù)轉(zhuǎn)向由專門的AI芯片進行處理,最終將芯片集成到終端設(shè)備上。
與此同時,隨著蘋果移動終端在拍照攝影、圖形處理等應(yīng)用上面越來越需要用到神經(jīng)網(wǎng)絡(luò)和機器學習、深度學習的算法運算,這些需求使得蘋果開始考慮將AI應(yīng)用的運算必須采用神經(jīng)引擎這一專門定制的處理器單元來完成這些計算。
2017年,蘋果的神經(jīng)引擎處理器正式落地。
不過讓外界驚訝的是,為何短短三年之中,A系列芯片的AI算力得到了將近20倍的提升,遠遠超出Soc芯片其他處理器的性能提升幅度?
一方面是CPU和GPU的性能,在現(xiàn)有的工藝制程進化和既定架構(gòu)的約束上提升已經(jīng)非常困難。隨著半導(dǎo)體工藝從7nm向5nm、3nm工藝升級,難度會越來越大,而可預(yù)期的提升卻可能并不顯著。反而AI加速器還會有相當大的設(shè)計提升空間。
另一方面是,終端應(yīng)用對于動用CPU和GPU的需求正在達到一個用戶的使用極限,因此也沒有快速增長的需求,但是這些應(yīng)用的AI算力需求則在大幅增長。
如果對蘋果iOS系統(tǒng)中的用到機器學習相關(guān)的功能和應(yīng)用進行分析的話,我們看到最新兩代的iPhone和iPad已然是一部各個部分和細節(jié)都在使用AI的終端了。
在蘋果終端的細節(jié)體驗,已經(jīng)有大量機器學習算法的加持,但相應(yīng)的體驗難以被用戶察覺。
比如,機器學習用于幫助iPad的軟件區(qū)分用戶在使用Apple Pencil繪圖時到底是不小心將手掌壓在屏幕上還是有意提供輸入的按壓。或者是在監(jiān)控用戶使用習慣,以優(yōu)化設(shè)備的電池壽命和充電頻次,既可以改善用戶在兩次充電之間的時間,又可以保證電池的使用壽命。
還有像iPhone的拍照,用戶每次按下快門,設(shè)備會快速連續(xù)拍攝很多張照片,然后經(jīng)過機器學習訓練的算法會分析每個圖像,并將其認為是每個圖像的最佳部分合成為一個結(jié)果。也就是iPhone拍照的卓越效果很大程度是靠“計算”出來的。蘋果正是通過iPhone中對圖像信號處理器(ISP)和神經(jīng)引擎的協(xié)同處理,才使得照片質(zhì)量獲得大幅提升。
蘋果在終端本地大幅提升神經(jīng)引擎的運算能力,以及配合圖形計算引擎和AI加速等功能,可以在移動終端中執(zhí)行非常高難度的機器學習任務(wù)。比如在iPad Pro上,通過神經(jīng)引擎的計算能力,結(jié)合Project Aero 軟件,iPad Pro 能將 PSD 中創(chuàng)作的每一個圖層以獨立的 AR 對象呈現(xiàn)在屏幕上,每個圖層都分離成一幕栩栩如生的景觀,這對創(chuàng)作者來說相當具有吸引力。
此外,蘋果已經(jīng)加入的顯著的AI新功能,諸如機器學習在翻譯、內(nèi)置聽寫、輸入預(yù)測、健康特性分析與預(yù)測上面,都需要大量的機器學習參與。
而蘋果選擇在機器學習任務(wù)的本地化計算的另一大原因,可能是為了將數(shù)據(jù)留在本地,用以保護用戶隱私。我們知道,機器學習的本質(zhì)就是對海量數(shù)據(jù)進行學習,而數(shù)據(jù)的采集和分析一直是谷歌、facebook這些互聯(lián)網(wǎng)公司的“原罪”,作為承諾嚴格遵守用戶隱私數(shù)據(jù)保護的蘋果,自然要做出保證,盡量將機器學習算法所需要的用戶數(shù)據(jù)留在用戶的移動終端當中,但與此同時要保證AI算法的有效,就必須對終端芯片的AI算力引擎做出大幅提升。
當然,蘋果自身終端系統(tǒng)對于AI算力升級的要求,只是一只內(nèi)生的吞噬算力的“猛虎”,在外部競爭中,蘋果還要面對一群實力強勁的“追龍”,在AI算力提升上不斷地應(yīng)戰(zhàn)。
安卓陣營的“追龍”,蘋果AI算力快速升級的外因
蘋果自研的A系列處理器芯片,一直以來以創(chuàng)新和高性能著稱,雖然最近兩年,安卓系的高端芯片,諸如高通的驍龍芯片、聯(lián)發(fā)科Helio芯片、華為海思的麒麟芯片則大有追趕之勢。
如果拋去綜合性能的討論,但是在AI芯片算力上面,高通的驍龍?zhí)幚砥髟谛阅苌虾蛿?shù)量上都已經(jīng)有超過蘋果A系列芯片的可能。
比如在2019年上半年手機AI芯片排行榜上,排名前十的智能手機AI芯片,其中前四名分別是高通驍龍855、蘋果A12 Bionic、聯(lián)發(fā)科Helio P90和海思麒麟980。但值得關(guān)注的是,除了第二、三、四名,這份榜單中的其他位置都被高通驍龍芯片占據(jù)。
與蘋果采取專用NPU芯片來提供AI算力不同的是,高通的驍龍?zhí)幚砥鞑捎昧水悩?gòu)計算的方式,推出了自研的AI引擎,通過CPU、GPU和DSP(Hexagon處理器)組合相互配合,運行神經(jīng)網(wǎng)絡(luò)計算的效率,根據(jù)不同的應(yīng)用場景來安排工作負載。
而預(yù)計在今年年底發(fā)布的高通驍龍875,同樣采用了5nm制程工藝,與7nm相比邏輯密度提高80%,其基礎(chǔ)性能較上代提升15%,功耗降低30%。非常激進的是,高通這次采用了ARM的Cortex X1超大核心設(shè)計,為“1+3+4”八核心三簇設(shè)計模式,其中1為Cortex X1超大核心,3為大核,采用Cortex A78,4為能效核心。據(jù)業(yè)界的預(yù)測,驍龍875無論在綜合性能還是在AI算力上都有超越A14的可能。
此外,高通通過AI引擎的的高、中端芯片布局,與不同的軟硬件企業(yè)一起,從底層框架、硬件核心、軟件等層面,將AI能力應(yīng)用到了海量的移動終端和智能設(shè)備上,形成基于AI應(yīng)用的合作生態(tài)。
高通在AI算力上的激進演化以及在AI能力上的不斷賦能,已經(jīng)開始形成對于蘋果的A系列芯片領(lǐng)導(dǎo)力的巨大威脅。在面臨安卓陣營這些“追龍”對手如此“給力”的努力下,蘋果自然也會有強大的外部動力來大幅升級自身的性能優(yōu)勢。就像驍龍875這樣的性能怪獸的出現(xiàn),始終會追在蘋果身后,準備吊打蘋果。
反過來看蘋果,其NPU的性能升級戰(zhàn)略也并未顯露頹勢。根據(jù)專業(yè)人士的說法,目前,蘋果A系列芯片上NPU占芯片總面積約為5%,未來NPU的面積能夠達到類似GPU占有的20%的面積的程度,AI算力至少還有4倍的提升空間,此外還有提升算法和芯片之間的協(xié)同設(shè)計,同時通過Core ML的進化來加強不同AI模型的異構(gòu)設(shè)計,同樣可以發(fā)揮其他SoC芯片部分的潛在算力??傮w來說,蘋果在AI算力的提升上面還有巨大的增長空間。
我們看到,蘋果和安卓陣營在高端芯片廠商在芯片性能的升級,正在從CPU所引領(lǐng)的摩爾定律的賽場轉(zhuǎn)向以AI算力增長為代表的新賽道上。而從AI算力的增長潛力來看,這一升級戰(zhàn)在未來幾年會更趨激烈。
然而最可惜的是,這場終端芯片AI角逐賽里,未來會缺席一位來自中國的實力選手。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。