原標(biāo)題:PaddlePaddle的榮耀瞬間,隱藏著大時(shí)代的中國式AI需求
以前看一部戰(zhàn)爭片的時(shí)候,對一位軍工廠領(lǐng)導(dǎo)的臺(tái)詞印象深刻。他是這么說的:前方的戰(zhàn)士看見我們運(yùn)過去的炮彈,心里比看見麻花都甜。
在一項(xiàng)事業(yè)或者工程進(jìn)行當(dāng)中,從業(yè)者對核心生產(chǎn)資源的那種期待,是外人難以估量和理解的。無論是戰(zhàn)爭、醫(yī)療還是工程,在現(xiàn)代工業(yè)體系中,毫無疑問資源就是一切。這種對基礎(chǔ)資源的期待,如今也發(fā)生在AI產(chǎn)業(yè)當(dāng)中。
AI的核心資源當(dāng)然有很多。但毫無疑問,深度學(xué)習(xí)框架是其中之一。毋庸諱言,中國的深度學(xué)習(xí)框架發(fā)展比歐美要晚,起步階段的失位和整個(gè)產(chǎn)業(yè)的高速發(fā)展,造成了中國AI開發(fā)者和創(chuàng)業(yè)公司們某種程度的“框架饑渴癥”。
好在這種情況正在被積極“治療”中。近兩年我們可以看到百度PaddlePaddle不斷進(jìn)行重大升級。而剛剛傳來消息,百度宣布成立深度學(xué)習(xí)技術(shù)平臺(tái)部,其隸屬AI技術(shù)平臺(tái)體系(AIG),由兩位AI技術(shù)專家于佃海、馬艷軍分任總架構(gòu)師和部門負(fù)責(zé)人。
成立專門部門進(jìn)行打造,毫無疑問意味著PaddlePaddle的戰(zhàn)略地位進(jìn)一步提升。從一個(gè)技術(shù)平臺(tái)到一個(gè)獨(dú)立部門,這個(gè)中國深度學(xué)習(xí)框架史上的首次操作,應(yīng)該可以看做AI產(chǎn)業(yè)的一次飛躍。
這次起跳意味著什么?有什么前因和后果?
讓我們把PaddlePaddle的幸福時(shí)刻定格在這里,看一看深度學(xué)習(xí)框架的中國之旅,背后都有怎樣的辛秘。
一個(gè)巨大的需求
PaddlePaddle之所以不斷上升,從技術(shù)資源、人才資源,再到今天的企業(yè)架構(gòu)資源,相繼往這個(gè)有點(diǎn)萌的名字上傾斜,背后的道理很簡單:PaddlePaddle卡住了一個(gè)巨大而且必需的市場需求。
百度于2013年成立深度學(xué)習(xí)實(shí)驗(yàn)室,并推出自主研發(fā)的深度學(xué)習(xí)平臺(tái),即PaddlePaddle的前身;2016 年 8 月,PaddlePaddle正式開源。該平臺(tái)對標(biāo)谷歌TensorFlow,是中國首個(gè)、也是當(dāng)前國內(nèi)唯一開源開放的深度學(xué)習(xí)框架。而這個(gè)首個(gè),也映射著當(dāng)時(shí)中國AI開發(fā)者三個(gè)難以搞定的真實(shí)需求:
一、中文需求
TensorFlow、caffe這樣的框架,當(dāng)然是沒有中文文檔和訓(xùn)練數(shù)據(jù)的。但是語言又是AI世界中的重中之重。總不能讓中國市場上的AI系統(tǒng)都說英語吧?在PaddlePaddle開源之前,還有個(gè)更痛苦的情況是,如果中文AI開發(fā)者訓(xùn)練的算法出問題了,他就必須越洋電話和郵件去找歐美的客服。這其中的溝通成本和效率可想而知。
所以當(dāng)PaddlePaddle開源,百度開始大規(guī)模為開發(fā)者提供中文訓(xùn)練文檔,以及中文客服,并不斷共享百度在語音交互這個(gè)強(qiáng)勢領(lǐng)域的數(shù)據(jù)與算法技術(shù),這對于中國AI開發(fā)者當(dāng)然是雪中送炭。僅僅靠這一點(diǎn),在AI開發(fā)的興起時(shí)刻,PaddlePaddle就確立了存在的意義與必要性。
二、大規(guī)模應(yīng)用需求
據(jù)說開發(fā)PaddlePaddle,最早在百度內(nèi)部的目的就是應(yīng)對TF等框架,不適應(yīng)大規(guī)模訓(xùn)練的問題。由于TF這樣的框架更偏于學(xué)院化和深層開發(fā),這就導(dǎo)致企業(yè)級AI應(yīng)用非常難適應(yīng)。而中國恰恰是一個(gè)流量大、數(shù)據(jù)多、用戶存量大的市場,歐美的小而精模式當(dāng)然水土不服。于是當(dāng)PaddlePaddle高舉大規(guī)模應(yīng)用的旗幟出現(xiàn),中國AI開發(fā)者,甚至不少歐美開發(fā)者當(dāng)然蜂擁而至。如今PaddlePaddle在持續(xù)升級下,系統(tǒng)穩(wěn)定性已經(jīng)可以支持工業(yè)界服務(wù)的規(guī)模,這在業(yè)界中也是首屈一指的,更加適合了中國市場AI與傳統(tǒng)行業(yè)結(jié)合、大規(guī)模互聯(lián)網(wǎng)AI應(yīng)用的真實(shí)情況。
三、國家安全需求
中興事件已經(jīng)可以看出,底層技術(shù)掌握在其他國家手中是相當(dāng)可怕的一件事。一言不合就給你掐斷上游,簡直沒地方講理去。
試想一下,安防、軍事等領(lǐng)域的AI應(yīng)用,假如用歐美框架訓(xùn)練那是多么可怕的一件事?這種情況下,完全自主掌握的AI框架變得格外重要。
而到目前為止PaddlePaddle已經(jīng)完成了從芯片到文檔,從框架到應(yīng)用工具的全面自主化。其還在NLP、知識圖譜、語音圖像等領(lǐng)域進(jìn)行了深度布局,能夠滿足從產(chǎn)業(yè)界到社會(huì)服務(wù)的不同AI開發(fā)需求,這也就讓整個(gè)國家經(jīng)濟(jì)體的AI發(fā)展安全系數(shù)大為飆升。所謂最適合中國國情的深度學(xué)習(xí)框架,并不只是說說而已。
占領(lǐng)了這些核心需求,PaddlePaddle開始了不斷積累升級,并在適當(dāng)時(shí)刻準(zhǔn)備沖刺與跳躍。這次百度成立深度學(xué)習(xí)技術(shù)平臺(tái)部,可以看做PaddlePaddle產(chǎn)業(yè)根基來到了全新階段。
日漸穩(wěn)固的根基
想要贏得未來,就必須穩(wěn)固住現(xiàn)在的優(yōu)勢與地位。而PaddlePaddle來到可獨(dú)立成為部門的節(jié)點(diǎn)上,實(shí)際也標(biāo)志著百度對PaddlePaddle目前產(chǎn)業(yè)根基與身位優(yōu)勢的判斷。
可以看到,三方面的領(lǐng)先優(yōu)勢支撐了PaddlePaddle可以獨(dú)立出來,擴(kuò)大招兵買馬規(guī)格,走上產(chǎn)業(yè)快速迭代的快車道:
一、技術(shù)已經(jīng)積累充足
深度學(xué)習(xí)框架的好壞,除了開發(fā)基礎(chǔ)之外,主要有幾個(gè)方面的技術(shù)來評定:工具是否健全而充足;顆粒精細(xì)程度能否滿足深度開發(fā)需求;社區(qū)建設(shè)與數(shù)據(jù)資源的建設(shè)水平。這些領(lǐng)域,中國的深度學(xué)習(xí)框架是一個(gè)必須快速追趕歐美,必須在緊迫時(shí)間完成連續(xù)升級的過程。好在PaddlePaddle基本已經(jīng)證明了技術(shù)建設(shè)速度可以被信任。
2016年開源之后,2017 年 11 月,百度發(fā)布更細(xì)粒度的新一代深度學(xué)習(xí)框架——PaddlePaddle Fluid;2018年7月的百度AI開發(fā)者大會(huì)(Baidu Create 2018)上,百度發(fā)布PaddlePaddle 3.0,包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以讓開發(fā)者平等便捷獲取頂尖AI能力的組件。
到目前為止,PaddlePaddle已經(jīng)組成了數(shù)據(jù)、工具、框架上的全面技術(shù)優(yōu)勢,可以與歐美一線框架看齊。
二、人才優(yōu)勢不斷擴(kuò)大
這次成立深度學(xué)習(xí)技術(shù)平臺(tái)部,據(jù)說PaddlePaddle將一舉成為40人的研發(fā)團(tuán)隊(duì)。而且兩位領(lǐng)頭人都在百度AI業(yè)務(wù)最前線奮戰(zhàn)多年,不僅對深度學(xué)習(xí)的理論和算法有深刻理解,還具有超強(qiáng)的產(chǎn)品和工程能力。
資料顯示,早在2010年,于佃海作為核心成員之一推動(dòng)了百度搜索使用機(jī)器學(xué)習(xí)的排序算法;2012年,百度開始深度學(xué)習(xí)的研究,于佃海是第一批研究人員,他帶頭研發(fā)的深度學(xué)習(xí)技術(shù)被百度多個(gè)產(chǎn)品廣泛應(yīng)用。馬艷軍曾獲國家科技進(jìn)步獎(jiǎng),并曾經(jīng)負(fù)責(zé)百度信息流內(nèi)容的技術(shù)研發(fā),大幅提升了信息流的用戶體驗(yàn),支撐了百度信息流實(shí)現(xiàn)高速增長。
兩位T10級別業(yè)界領(lǐng)軍人物帶隊(duì),展現(xiàn)出了百度豪華的AI人才儲(chǔ)備。圍繞PaddlePaddle,無論是人才成長還是人才吸引力,都已經(jīng)達(dá)成了國際水準(zhǔn)。
三、身位優(yōu)勢不斷加強(qiáng)
在AI產(chǎn)業(yè)發(fā)展上行到新局面,AI與IoT結(jié)合不斷加深、傳統(tǒng)行業(yè)應(yīng)用AI潛力被釋放、無人駕駛等領(lǐng)域風(fēng)口來臨的時(shí)候,AI基礎(chǔ)設(shè)施的價(jià)值也相應(yīng)地被放大。但是就國內(nèi)市場而言,想要在短期內(nèi)再出現(xiàn)可開源,并且工具化相應(yīng)完善的深度學(xué)習(xí)框架,基本已經(jīng)是極小概率事件。而且社群建設(shè)與生態(tài)建設(shè)更是需要時(shí)間。早投入早回報(bào),已經(jīng)開始讓PaddlePaddle呈現(xiàn)出產(chǎn)業(yè)周期紅利。
戰(zhàn)略資源不斷升級,百度體系內(nèi)的地位不斷明晰,國際影響力與吸引力不斷增強(qiáng)。等等優(yōu)勢讓PaddlePaddle值得被加大投入力度,達(dá)成更高水準(zhǔn)的產(chǎn)業(yè)聚合。而與此同時(shí),PaddlePaddle的未來要走向哪里,似乎也再愈發(fā)的明晰了起來。
已然清晰的方向
成立專門部門之后,PaddlePaddle會(huì)走向何方,這或許是一個(gè)大眾比較關(guān)心的問題。但是就PaddlePaddle的過往發(fā)展歷程而推斷,其發(fā)展方向其實(shí)一直非常明確。所做的是在推動(dòng)產(chǎn)業(yè)迭代速率,為已經(jīng)清晰明確的方向添柴加火。
從過往分析,“兩化一目標(biāo)”似乎可以被視作PaddlePaddle的未來。
一、基礎(chǔ)設(shè)施化
PaddlePaddle自誕生之日起,到不斷的重大升級和產(chǎn)業(yè)迭代,都是以成為中國AI產(chǎn)業(yè)與廣大開發(fā)者的基礎(chǔ)設(shè)施為目標(biāo)。而在今天的獨(dú)立特性確立,生態(tài)化基礎(chǔ)牢固之后,PaddlePaddle勢必將進(jìn)一步加強(qiáng)自身成為AI產(chǎn)業(yè)基礎(chǔ)設(shè)施的優(yōu)勢,與產(chǎn)業(yè)深度結(jié)合,不斷向開發(fā)者開放新的資源與產(chǎn)業(yè)優(yōu)勢。伴隨著百度在無人駕駛、對話式AI,以及AI技術(shù)綜合應(yīng)用領(lǐng)域的擴(kuò)展,PaddlePaddle也將持續(xù)加深行業(yè)下沉力,完成其成為基礎(chǔ)開發(fā)必經(jīng)之路的產(chǎn)業(yè)使命。
二、生態(tài)化
AI不能閉環(huán),必須無功利地開放和共享,造就持續(xù)有生命力的AI開發(fā)環(huán)境,這是已經(jīng)在世界AI開發(fā)舞臺(tái)上得到印證的判斷。但中國的AI開發(fā)生態(tài)僅剛剛起步,必須有更強(qiáng)的生態(tài)賦能方案出臺(tái),催化開發(fā)生態(tài)的成熟。
這是PaddlePaddle的第二個(gè)目標(biāo),也是其成立專門部門的核心支撐因素:提高生態(tài)賦能能力,建設(shè)縱深度和生命力更強(qiáng)的AI開發(fā)群落。
目前我們看到PaddlePaddle對開發(fā)者的全方位扶持已經(jīng)不僅局限于技術(shù)框架。公開課、AI大賽、與高校合辦師資培訓(xùn)班等等方式都成為常態(tài)。而穩(wěn)固的生態(tài)會(huì)堆積成雪球效應(yīng),這也是AI產(chǎn)業(yè)的必須要求。
在百度AI開發(fā)者大會(huì)上,我們已經(jīng)看到PaddlePaddle生態(tài)化的成果。比如北京工業(yè)大學(xué)的四位學(xué)生利用PaddlePaddle制造了一臺(tái)智能桃子分揀機(jī),實(shí)現(xiàn)桃子的自動(dòng)分揀;援藏醫(yī)生陳靜飛借助基于PaddlePaddle的定制化訓(xùn)練與服務(wù)平臺(tái)EasyDL,進(jìn)行顯微鏡下寄生蟲蟲卵識別。這些能夠改變產(chǎn)業(yè)效率,甚至承擔(dān)社會(huì)責(zé)任的AI開發(fā),都是從PaddlePaddle的生態(tài)化進(jìn)程中汲取而來。
三、目標(biāo)專精于工業(yè)應(yīng)用
AI的未來在于與經(jīng)濟(jì)體結(jié)合,成為工業(yè)體系換發(fā)活力的再生藥水。那么對深度學(xué)習(xí)開發(fā)框架的最高要求,就是能夠全面賦能工業(yè)體系,提高工業(yè)級應(yīng)用AI的可能性,降低準(zhǔn)入門檻。
厲兵秣馬的PaddlePaddle,已經(jīng)將目標(biāo)對準(zhǔn)了工業(yè)級應(yīng)用。目前PaddlePaddle已經(jīng)開放近20種工業(yè)級模型,各項(xiàng)AI技術(shù)被廣泛應(yīng)用于生產(chǎn)中。
從PaddlePaddle的明晰目標(biāo)中可以看出,中國AI開發(fā)的大任只是剛剛開始而已。有了基礎(chǔ),還需要有不斷的投入和社會(huì)意愿的激發(fā)。但無論怎么說,PaddlePaddle都是一種開始。
美妙的開始,是一切想象力與恢弘故事的源頭。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。