原標題:AI系統(tǒng)化風潮漸顯,PaddlePaddle如何應對開發(fā)者爭奪戰(zhàn)
最近很多海外企業(yè)之中在發(fā)生一種很有趣的改變,那就是AI正在脫離其他部門附屬品的角色,成為一個獨立的部門或事業(yè)部。
先是CEO納德拉對微軟大動干戈地進行了重組,將原Windows部門重組成“設備與體驗”和“云計算與人工智能平臺”。很快谷歌也宣布將原來的人工智能及搜索部門一分為二,將人工智能部分獨立出來,歸由原來谷歌大腦的負責人Jeff Dean領導。不久蘋果又挖角了谷歌前人工智能及搜索部門主管John Giannandrea,任命其領導機器學習和人工智能戰(zhàn)略并直接向Tim Cook匯報。
對于AI行業(yè)來說,這顯然是好消息。谷歌和微軟一樣,原本將AI與自身最核心的業(yè)務歸攏在一起,如今將兩者區(qū)分開來,無疑是一種提升對AI重視程度的表現(xiàn)。未來的風向或許是,深度學習不再是某一項業(yè)務的衍生品或附庸,甩掉原生根系的糾纏,走向獨立發(fā)展、高頻競爭的快車道時代。
而在整個AI快道比拼當中,硬件算力、數(shù)據(jù)算法等等元素無一不處于白熱化的競賽之中,幾乎每天都有新的論文、新的產(chǎn)品問世??呻[藏在快道底層的,卻是一個極易被忽視,但卻實際至關重要的問題——深度學習開發(fā)框架。
每位AI開發(fā)者每天都會使用它,可外界對它的關注卻少之又少。但深度學習開發(fā)框架絕非一灘死水,悄然之中谷歌、Facebook、百度三大AI巨頭,正在圍繞深度學習框架展開一場新的“三國殺”。
AI要沖:深度學習正在變成一件更專注、更系統(tǒng)的事
在谷歌原來的業(yè)務結構中,谷歌大腦本是一個偏重于研究的團隊,在深度學習、NLP、CV等等領域的國際期刊和學術上發(fā)表了大量論文,并且將開發(fā)框架TensorFlow歸攏到自己旗下。
隨著近一兩年間AI相關技術的應用性增強,谷歌大腦的上述研究結果也開始有機會進一步投入產(chǎn)業(yè)。谷歌這一次提升AI業(yè)務的重要性,或許是在謀劃AI業(yè)務獨立開發(fā)和系統(tǒng)性業(yè)務布局的可能——AI與工業(yè)、AI醫(yī)療影像……當技術前景越來越廣闊時,就進一步展現(xiàn)出了深度學習開發(fā)框架在產(chǎn)業(yè)關系中的戰(zhàn)略要沖地位。深度學習開發(fā)框架可以圈定開發(fā)者和應用,從而釋放谷歌在AI方面的技術能力和未來TPU的計算能力。
巨頭們紛紛開始調(diào)整架構,意味著深度學習正在走向系統(tǒng)化和專注化,這以數(shù)據(jù)、感知與運算的深度纏繞的產(chǎn)業(yè)領域,開發(fā)以及開發(fā)者生態(tài)自然成為了產(chǎn)業(yè)活躍度的基石,有關開發(fā)生態(tài)的競爭則直接體現(xiàn)在了深度學習開發(fā)框架的發(fā)展中。
比如,F(xiàn)acebook就不愿讓谷歌獨享深度學習開發(fā)平臺帶來生態(tài)收益,在去年年初推出了針對意味十足的開發(fā)平臺PyTorch。并且在去年9月聯(lián)手微軟旗下的CNTK和Caffe2,推出了一套開放的神經(jīng)網(wǎng)絡交換格式,為的是在谷歌生態(tài)愈發(fā)封閉時,提升場內(nèi)其他選手之間框架格式的互通性。
而在中國,百度的PaddlePaddle也在不斷發(fā)展,憑借本土化特色吸引了國內(nèi)的開發(fā)者,綜合GitHub pull request的數(shù)據(jù)來看,PaddlePaddle已經(jīng)成為了全球開發(fā)熱度增速最高的開源深度學習平臺。同時隨著百度在斯坦福、加州伯克利等海外高校頻繁開展技術交流活動,PaddlePaddle甚至在逐步走向世界舞臺。
不知不覺間,這三大科技巨頭專屬的深度學習框架,正在展開一場新的三強爭霸。
降低一切門檻:開發(fā)框架三國殺在爭什么?
在我們談論AI開發(fā)時,我們就究竟在談論什么?
·更多的開發(fā)者:開發(fā)者數(shù)量顯然是一切的前提,數(shù)量廣闊的開發(fā)者就像蒲公英的種子,會把深度學習開發(fā)框架以及相關的軟硬件服務帶到各個企業(yè)中去,幫助巨頭們的AI布局在四處扎根生長。
·更活躍的開發(fā)生態(tài):建立在大量開發(fā)者數(shù)量之上,用案例和經(jīng)驗對開發(fā)社區(qū)進行填充,鼓勵開源和共享,讓AI的開發(fā)變得更加簡單,從而進入更多行業(yè)和場景。
·更高級別的開發(fā)項目:自身框架中誕生一款殺手級應用,可能是每個巨頭都會有的理想目標。高價值和高效用的應用AI很可能帶來大量簇擁者,一齊涌向該框架的生態(tài)之中。
總之,如何降低門檻以一切手段吸引開發(fā)者進入,成為了三大開發(fā)框架的共同目標。
最典型的例子就是TensorFlow與PyTorch之間的競爭。
在目前的開發(fā)框架中,TensorFlow憑借著谷歌的技術優(yōu)勢一直表現(xiàn)的較為強勢,在開發(fā)者越來越多時,其開發(fā)社區(qū)生態(tài)也在進行良性發(fā)展。
但占據(jù)了優(yōu)勢后,TensorFlow開始隨著谷歌一同收攏自身的開發(fā)生態(tài)。比如谷歌曾經(jīng)推出過一系列賦能開發(fā)者的培訓計劃,向開發(fā)者提供課程教學。但結果是所有的教學全部都建立在TensorFlow之上,所提供的硬件API也只能接入TensorFlow,而TensorFlow的社區(qū)資源和開發(fā)工具更新,又部署在谷歌云之上。并且TensorFlow在最近單方面和Caffe等開發(fā)平臺“友盡”,使得開發(fā)者們無法進行平臺之間的遷移。
而Facebook就抓住了這一點。將原來的開發(fā)工具Torch進行升級,聯(lián)手微軟打造神經(jīng)網(wǎng)絡交換格式幫助開發(fā)者降低遷移成本。同時PyTorch設計了更方便的數(shù)據(jù)加載API接口,使開發(fā)過程中加載并行數(shù)據(jù)更加順暢,相比TensorFlow降低了不少API方面的學習成本。
在自定義擴展上,PyTorch也改變了TensorFlow依靠樣板代碼才能實現(xiàn)的情況,通過為CPU/GPU編寫接口這種更易行的方式添加自定義拓展,使得開發(fā)過程中的自由度大大提高。
綜合來看,在開發(fā)框架的競爭中,賽點在于更低的學習成本和遷移成本,以及更高的易用性和社區(qū)友好度。
在這幾個方面,西方戰(zhàn)場之外的PaddlePaddle也以靈活、易用著稱。
在應用效率上,PaddlePaddle在運行RNN算法時比其他主流框架占用更少的內(nèi)存,速度卻提升了1-2倍。
在訓練部分的調(diào)用方式上PaddlePaddle集中了瀏覽器和客戶端等多種主流調(diào)用方式,并支持CPU、GPU、FPGA等多種硬件,從而極力降低開發(fā)成本。同時還支持多種深度學習模型,使得開發(fā)者可以更關注模型的高層結構,拋開底層編碼,使得 TensorFlow 里需要數(shù)行代碼才能實現(xiàn)的功能,在 PaddlePaddle 里可能只需要一兩行。
除此之外,PaddlePaddle還展示出了很多適用于應用層面的功能。例如在最新的Fluid版本中讓開發(fā)過程更接近常見的高級語言,減少深度學習中“黑箱”狀況的出現(xiàn),讓開發(fā)者不再用“玄學”調(diào)參,更進一步明晰開發(fā)和優(yōu)化中產(chǎn)生的對應關系,使得開發(fā)過程更有可復制性。
還包括PaddlePaddle支持彈性使用計算資源完成深度學習訓練,根據(jù)需求變化設置資源消耗的彈性區(qū)間。對于時常面對著繁多計算任務的大型企業(yè)來說,此舉可以幫助他們節(jié)約大量資源,讓深度學習的開發(fā)和訓練成本進一步降低。
近日有新聞報道,Google發(fā)布TensorFlow.js,支持在瀏覽器上進行機器學習的相關工作,但在降低開發(fā)者使用瀏覽器發(fā)展機器學習的門檻方面,PaddlePaddle確實做得更早也相對成熟。同時為了讓更多開發(fā)者和企業(yè)能夠?qū)F(xiàn)有項目接入到中PaddlePaddle,PaddlePaddle做到了從基礎訓練到分布架構徹底開源。這一點即使在以開源精神著稱的硅谷都很稀有。
當然在中國市場范圍來看,PaddlePaddle最大的優(yōu)勢還是擁有唯一提供適用中文文檔與數(shù)據(jù)集的開發(fā)框架社區(qū)。中國市場作為區(qū)別于歐美世界之外的獨立極,坐擁龐大的中國AI產(chǎn)業(yè)與開發(fā)集群,這些產(chǎn)業(yè)和開發(fā)者都需要適用于本土的經(jīng)驗體系,也自然會被PaddlePaddle的社區(qū)氛圍吸引。綜合這些優(yōu)勢,PaddlePaddle完全可以與歐美巨頭們一戰(zhàn)。
關注未來紅利:PaddlePaddle的崛起帶來中美AI對標新命題
在理想狀態(tài)下,通過開發(fā)框架牢牢把控開發(fā)者體系,在自身平臺上不斷產(chǎn)生生態(tài)效應,收割未來必然出現(xiàn)的AI時代現(xiàn)象級產(chǎn)品與應用,這一流程才是巨頭們所關注的目標。
同時我們要知道,所謂的把現(xiàn)象級產(chǎn)品和應用放到AI這一定語之下,就意味著這些應用可能與社交媒體聯(lián)系,關乎著我們的輿情數(shù)據(jù),也可能與自動駕駛聯(lián)系,關乎著每一輛汽車的行駛路線。
在這時我們不得不提出另一個可能,在中美貿(mào)易戰(zhàn)的大背景下,中國AI開發(fā)群體,尤其是AI企業(yè),使用TensorFlow等平臺的風險指數(shù)正在提升。
就拿美國向全球提供免費GPS技術來說,曾經(jīng)很多國家甚至在軍用設施上也利用GPS進行定位技術,但在99年印巴戰(zhàn)爭時,美國出于利益直接關閉了印巴地區(qū)所有的GPS服務。想象一下,兩軍交戰(zhàn)之時,忽然所有人都不知道自己的位置信息,這是一件多么恐怖的事情?
最近中興被裹挾在中美貿(mào)易戰(zhàn)爭中,進而引發(fā)的芯片恐慌更提醒了我們,市場經(jīng)濟和全球化不會是一柄絕對中立的保護傘,技術的自主權很可能在關鍵時刻成為阿克琉斯之踵。這一點在人工智能中更是如此。
如今TensorFlow早已不再是單純的開發(fā)框架,而關系著技術、云服務等等多種模塊。如果同樣的狀況復制到AI上,如果有一天深度學習模型已經(jīng)埋藏在我們生活作業(yè)的種種細節(jié)深處,谷歌卻因為種種原因停止向中國提供云服務,我們連遷移模型都十分被動。因而造成的結果很可能比今天的芯片問題更加恐怖,自動駕駛突然失靈,自動化工業(yè)生產(chǎn)突然向人力求救,這一切造成的不僅僅是生產(chǎn)效率的降低,而是人們的生活陷入混亂。
這時PaddlePaddle對于中國開發(fā)者的優(yōu)勢,就不僅僅是易用性和靈活性了。PaddlePaddle的適時崛起,似乎在將開發(fā)者引入另一種可能:建立完全本土化的開發(fā)框架和社區(qū),連接在地化的數(shù)據(jù)、計算服務和技術,中國AI可以實現(xiàn)由開發(fā)到技術創(chuàng)新,再到產(chǎn)業(yè)模塊與商業(yè)化的完全自生態(tài)流程。而PaddlePaddle的快速部署優(yōu)勢,可以讓中國開發(fā)者在世界范圍內(nèi)的AI應用競賽上獲得更多速度優(yōu)勢。或許當海外還在利用TensorFlow調(diào)試底層代碼時,中國開發(fā)者就已經(jīng)通過PaddlePaddle實現(xiàn)模型的應用了。AI自生態(tài)的靠攏過程不是因為躲避風險,而是因為本土化的確是更高效的選擇。
這樣一來,中國AI領域就可以完全脫離對美國的依賴,這在兩國科技產(chǎn)業(yè)競爭的大背景下,由此帶來的自主和安全就顯得尤為關鍵和重要。如今深度學習開發(fā)框架的競賽剛剛開始,代表著中國AI開發(fā)品牌,甚至中國AI未來紅利的PaddlePaddle如何布局,或許會為這場競爭增加更多看點。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。