在今天的商品環(huán)境之下,我們似乎已經(jīng)習慣于每一部智能手機、平板電腦、筆記本電腦、臺式機以及服務器都配備著相似度極高的小型芯片組。但回顧歷史,我們會發(fā)現(xiàn)整個計算世界曾經(jīng)擁有著高度多樣化的硬件“心臟”。如今,這種遺產(chǎn)仍然廣泛存在于超級計算這一特定領域之內(nèi),各種奇特的硬件努力壓榨著每一個可用的指令周期。隨著游戲與高強度圖形工作負載總量的激增,GPU形式的專用加速器硬件也開始呈現(xiàn)出標準化趨勢。更重要的是,深度學習的興起與指數(shù)級增長的復雜化與專業(yè)化工作負載推動著專業(yè)硬件的又一輪復興——這一次,企業(yè)將自主構(gòu)建芯片以盡可能多地提升效率與速度。
從谷歌的TPU到亞馬遜的Inferentia芯片,現(xiàn)代云計算企業(yè)幾乎都需要根據(jù)自身在AI前沿建立起的經(jīng)驗打造屬于自己的深度學習加速器。這些公司在很大程度上將自己的成果限制在內(nèi)部使用,不過也有谷歌這樣的技術(shù)巨頭將自己的TPU以“輕量化”Edge TPU的形式提供給外部用戶。
憑借著在GPU設計中積累到的豐富經(jīng)驗,英偉達公司的硬件長期以來一直是深度學習領域的中堅力量,而且從對原有GPU成果的復用轉(zhuǎn)向更積極的深度學習研發(fā)。而如果以我所關注的統(tǒng)計指標出發(fā),世界各地的企業(yè)都在努力打造自己的定制化芯片設計以及COTS硬件組件,旨在進一步加速訓練與推理流程,進而構(gòu)建起規(guī)模更大的學習模型。
與此同時,正如谷歌Edge TPU版本所帶來的明確信號,AI技術(shù)正日益走向市場前沿。我們正親眼見證著一系列AI應用的實際落地,包括它們在精度、功耗與移動性等方面做出的不同需求權(quán)衡。
對于那些必須追求最高精度的應用程序,用戶仍會將推理流程外包給云端,包括利用有線、4G或者無線連接將輸入數(shù)據(jù)流傳輸至GCP、AWS以及其它云服務供應商進行處理。
然而,對于連續(xù)實時視頻處理(例如遠程監(jiān)控攝像機網(wǎng)絡)場景而言,這種帶寬受限的解決方案無疑不夠?qū)嵱?。這就意味著推理模型需要完全在本地設備上執(zhí)行。
部分廠商傾向于使用混合模型,即利用板載過濾機制對內(nèi)容進行初步識別,而后將復雜度較高的部分交由遠程計算資源處理。
功耗是此類應用的主要限制性因素,要求設計者在原始處理能力、功耗與芯片產(chǎn)生的熱量之間進行認真權(quán)衡。
無人駕駛汽車對于深度學習硬件提出的要求更為嚴苛,對其固定窗口截止時間、高精度、高帶寬輸入以及低功耗特性都有著具體限定。而且,這一切都必須全面運行在車輛之上,而不可能將現(xiàn)場的數(shù)據(jù)重新發(fā)送回云端。
特斯拉公司已經(jīng)推出了專用型深度學習硬件,并宣稱其新型芯片代表著無人駕駛功能的未來。有趣的是,這場宣傳最終引發(fā)了特斯拉與其前供應商英偉達之間的口水戰(zhàn)??偠灾碌腁I硬件的激增以及越來越多企業(yè)選擇自主構(gòu)建推理設備,不禁讓我想到深度學習領域的浪潮是否只是又一場淘金熱。換言之,面對這么多未知數(shù)與漫長的開發(fā)周期,今天的前沿芯片是否可能會成為明年的電子垃圾?
總而言之,目前大部分與深度學習相關的工作負載仍然發(fā)生在云端,大多數(shù)企業(yè)的最佳選項可能是直接將他們的AI需求外包給體量巨大的商業(yè)云供應商,從而輕松利用最新一代英偉達GPU硬件提供的全部優(yōu)質(zhì)資源與尖端設計。而從TPU與Inferentia芯片,到各類由其它公司發(fā)布的面向移動環(huán)境的低功耗硬件,云中心到邊緣位置正在逐步實現(xiàn)無縫對接。
在某些情況下,云廠商甚至能夠提供同樣的訓練工作流程構(gòu)建起精度最高的模型,并允許客戶使用完全相同的工具與訓練數(shù)據(jù)。這意味著用戶只需要單擊鼠標,即可在移動設備上使用低配置低功耗版本。
最重要的是,深度學習仍是一個動態(tài)化極高且快速發(fā)展的領域,云計算的支持能夠很好地隔離這種變化因素,確保企業(yè)客戶在無需擔心底層硬件的前提下構(gòu)建并運用最先進的模型。正如基于普通 CPU的云虛擬機能夠不斷迭代更強大的硬件而無需修改代碼一樣,云端深度學習服務將在云廠商的巨大投資中得到巨大提升,包括盡可能把不斷改進的加速器所帶來的復雜性挑戰(zhàn)抽象出來。例如,面向谷歌公司上一代TPU加速器構(gòu)建的代碼仍能夠在最新一代硬件上不加修改而直接運行,并在不改變代碼行、重新編譯或者任何重構(gòu)的情況下實現(xiàn)可觀的性能提升。
對于那些身處深度學習邊緣位置的從業(yè)者來說,當前的云體系可能正是AI工作負載的最佳運行環(huán)境。而從世界上最強大的推理硬件,到面對硬件持續(xù)改進所必需的執(zhí)行穩(wěn)定性,再到由云到邊緣位置的領先無縫式軟件開發(fā)環(huán)境,圍繞深度學習建立起來的完整體系正在逐漸成型。
也許更重要的是,云環(huán)境確實是幫助世界一流AI企業(yè)完成研發(fā)工作的首選平臺。通過這一強大助力,AI“帝國”們將能夠立足云端推動深度學習領域的整體進步。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )