原標題:謝天謝地,AI開發(fā)者的“吐槽大會”終于結束了
今天是個被AI圈刷屏的日子。
原因不是谷歌新手機和波士頓動力的機器人,而是華為發(fā)布了一款新的AI開發(fā)平臺:ModelArts。
我粗略統(tǒng)計了一下,AI從業(yè)者與開發(fā)者們之所以瞬間被撩到嗨點,是因為國內看似熱鬧無比的AI行業(yè),其實已經很久沒有AI開發(fā)相關的重要項目出來了。ModelArts一出來,有一種終于被重視了的“久旱逢甘霖”體驗。
這事其實非常吊詭:AI再怎么宏大敘事,不也要靠開發(fā)者一磚一瓦蓋起來嗎?可偏偏AI行業(yè)是PPT邏輯圖發(fā)了不少,用來干活的家伙卻屈指可數。
而AI開發(fā),在今天并不是一個多么成熟的工作,其中問題與矛盾非常顯著。
在HC大會第三天,華為云分析了今天AI開發(fā)的困境。今天限制AI開發(fā)的兩個主要因素,一個是快,一個是慢,兩者形成了相互依賴的矛盾體,解決一個要依賴另一個的大幅改善。
可以說,這是對AI開發(fā)現狀的精準判斷。
而ModelArts的價值也不僅是刷屏朋友圈,而是與其他AI開發(fā)工具一起,從全流程、普惠的角度針對性解決了今天AI開發(fā)中幾個最明顯的“槽點”。
想要明白ModelArts與AI開發(fā)生態(tài)的背后秘密,咱們要先從這些“槽點”說起。
寫到這,其實筆者心中的洪荒之力已經按耐不住了。因為長時間采訪AI開發(fā)者,筆者電腦和大腦里都存儲了無數開發(fā)者的吐槽——要不是因為擔心收視率不高,我都能做好幾期AI吐槽大會了......
謝天謝地,好在這一切終于快結束了。
每一個都是戰(zhàn)士:夠開幾季“吐槽大會”的AI開發(fā)者們
好,大家嚴肅點,下面開始吐槽了。
經過長時間追蹤AI開發(fā)者,我們的記者團隊一致認為今天這個行業(yè)都是戰(zhàn)士。尤其是那些希望用AI開發(fā)來創(chuàng)業(yè)的,更是戰(zhàn)士中的斯巴達克斯。這里咱們可以看幾種最有槽點,不對,是最典型的AI開發(fā)案例:
案例1:親朋好友一起上型AI開發(fā)者。我們知道,AI里有個詞叫做AI民工,或者數據民工。就是說AI訓練之前,其實有大量時間沒干別的,就是做數據標記。這個活其實非常簡單,但問題是極其枯燥大量重復,并且一旦某些數據標記錯,很可能帶給開發(fā)者后面訓練時以“無限驚喜”。
而我們了解到的情況是,雖然大家都在說所謂AI民工,但這個崗位由于非常新穎且上下不靠,即使在大公司也是稀缺資源。而對小團隊開發(fā)者來說,哪里找AI民工來標記數據?。克院芏嗳说慕鉀Q方案,就是親戚群里發(fā)紅包幫標點數據、老同學里叫一聲幫我弄點數據,更有甚者我見過朋友圈眾籌標數據的——做AI,愣做出了拼多多購物的既視感。
案例2:“Boss求求你了”型AI開發(fā)者。這種開發(fā)者一般存在于科研機構和高校中,以在讀博士為主要人群。他們寫完模型,等著變成paper,于是想用學校買的架構驗證一下。那么好,先登記排隊。輪到號了訓練一下一星期過去了,結果發(fā)現不太對?挑個參數又一星期,優(yōu)化一下數據集又一星期。由于師兄師弟不少,還就經常輪不上你。
模型錯誤幾次,這類開發(fā)者和他們的導師都很容易抓狂。于是經常出現這樣一幕:某某AI博士哭訴“Boss大人求求你了再讓我算一次吧”。
案例3:創(chuàng)業(yè)焦慮型AI開發(fā)者。創(chuàng)業(yè)AI開發(fā)者,注重更多的是在部署和應用,而巧的是坑也在這里。我們采訪過一個案例,開發(fā)者做了一個教育類的深度學習算法,但在部署時卻發(fā)現,TensorFlow上訓練的模型不支持大規(guī)模GPU并用,給后續(xù)帶來了無盡麻煩。
部署難,一部署就出錯,是很多AI開發(fā)者面臨的瓶頸。創(chuàng)業(yè)團隊辛辛苦苦訓練了個聰明的模型,一投入應用就變傻子,這感覺豈是一個酸爽了得。
案例4:理想豐滿型AI開發(fā)者。AI大潮襲來,也催生了很多非科班出身,尤其是IT工程師轉型AI。結果一入門發(fā)現,各種算法算力算子不計其數,調參配比極其復雜。而且AI的黑箱性還帶來一種“養(yǎng)蠱”的快感,入門級選手連錯都不知道哪錯了。最終只能是AI前景遠大,AI理想豐滿,AI讓我暫時撤退……
案例5:早知如此型AI開發(fā)者。 AI開發(fā),經常要經過N個版本的優(yōu)化和再訓練,當然這就跟做設計一樣,經常結果是第一版最好。于是經常出現老板或者導師沉思了一下,說:我覺得三版之前那個蠻好的,找出來數據再優(yōu)化一下吧。呵呵噠,三版之前是啥天知地知反正我不知——遇到這種情況,開發(fā)者經常只能捶地大喊:早知如此何必……
案例6:對不起有點狂,因為可吐槽的案例實在太多了,就說最后一個吧。還有一種“社區(qū)大神”人設的AI開發(fā)者,專注混社區(qū)五百年。貌似啥都會,就是不會賺錢。我們見過盜用大神分享的工具和數據拿到融資,但大神愣不知道的。AI開發(fā)人才如何實現IP保護和變現,其實也是個大問題。
AI開發(fā),是個有多重要就有多少無奈的行當。
好在,以上這密密麻麻的槽點,已經被華為剛發(fā)布的ModelArts以及相關工具“一劍斬群寇了”。
讓“貝爺”們都進星級廚房:華為做了個什么事?
假如說,開發(fā)者是一位位大廚,打算為我們端上美味的AI大餐。
那么今天AI開發(fā)的問題,就是大廚們不是穿戴整齊走進廚房煎炒烹炸。而是上山找芯片調算力,下海找人標數據,進林子里采工具,到亂世從中跑訓練。好端端的一位大廚,愣被割裂的開發(fā)場景和高企的費用給逼成了《荒野求生》的貝爺。
而假如一位廚師要從上山打獵開始做起,又怎么能期望他燉肉效率高呢?
為什么會這樣?
原因在于今天的深度學習訓練流程,是在一個個偶然、垂直條件下產生的。開發(fā)框架有的是最開始僅供少部分科研,有的是僅供企業(yè)內部調用;數據集和算子,是經過各種偶然因素,被不同人或組織開源的;AI算力,最早都是附加在IT算力上的“增值服務”。而一些自動機器學習項目,則噱頭價值遠大于實際部署價值——于是四面奔波,不斷解決兼容問題就成了開發(fā)者的常規(guī)操作。
而華為云剛剛在HC大會上拿出來的ModelArts,特質就在于它把以上場景全都整合到了一套云服務體系下。開發(fā)者可以不離開系統(tǒng),完成從數據標記與訓練準備,到訓練、調試、推理、部署等所有工作。
這就好比打造了一整套星級廚房,里面有水電燃氣,各種廚具食材,那么開發(fā)者將省去前面無比漫長的準備工作,直接一展廚藝可矣。
具體來說,名為ModelArts的廚房,跟以前常規(guī)用的“野炊”模式相比,有四大直觀改變:
一、食材隨意購
AI開發(fā)者能夠快速完成數據標記,就像廚師能夠快速買到食材一樣重要。畢竟做廚師,沒有先從養(yǎng)殖場干起的——知道的我是AI開發(fā)者,不知道還以為我是數據農家樂呢!
針對最耗時的數據標記環(huán)節(jié),ModelArts內置了AI數據框架,以AI機制來治理數據,用迭代訓練來解決標注的數據量問題。也就是讓AI來完成數據標注本身,不斷優(yōu)化數據集,從而讓數據標注與準備效率百倍提升。
當然,數據還是開發(fā)者來準備,只是準備體驗將獲得巨大躍升。
二、開灶有火
AI模型的訓練速度,關乎于AI算力的提供,也關乎于訓練平臺的路徑優(yōu)化。AI訓練過程就像點火做飯,火夠大當然炒菜更快。針對訓練效率問題,ModelArts通過各類優(yōu)化技術,達成了在同樣的模型、數據集和同等硬件資源情況下,模型訓練耗時降低一半——換句話說,這意味著同樣算力可以供給多一倍的開發(fā)者使用。
三、廚具齊全
上面說過,AI最怕部署,有些AI模型甚至有“見光死”的特點。尤其面對部署在不同的軟硬件架構上,給人一種東家借口鍋,西家偷個鏟的感覺。而基于全棧AI解決能力,ModelArts實現了一鍵推送模型到所有邊緣、端的設備上的能力,并支持在線部署和批量推理,滿足大并發(fā)和分布式這些最困難的部署方式??芍^一應出具俱全,做出什么菜式都不在話下。
四、還有廚房家電都能幫忙
AI開發(fā)者的最后問題,可能是機器學習訓練中的技術門檻。針對于此,ModelArts不僅給出了明確的教學演練,還創(chuàng)造性地引入了AI自動學習功能,包括模型的自動設計與自動調參等,可以給開發(fā)者智能化幫助。
此外,ModelArts還實現了全流程可視化管理,不管丟在哪里的數據和模型都能準確找到,這也間接有利于AI黑想象的攻克。
這些蘊藏的“AI黑科技”,就像冰箱微波爐這些現代廚房神器,以AI開發(fā)AI,降低開發(fā)者技術門檻,或許是接下來新的潮流。
值得注意的是,華為云這次不光發(fā)布了“廚房”,還帶來了“餐廳”。于是我們看到了機器視覺開發(fā)平臺HiLens,以及離線開發(fā)套件Atlas 200 、量子計算模擬器與編程框架HiQ,讓開發(fā)者可以模擬重要環(huán)境的實際應用場景。
據華為云介紹,ModelArts將在年底前上線,我們會第一時間帶來上線評測。
全棧AI的第一個紅利:為什么ModelArts敢說“全生命周期”?
在采訪中,華為云認為,目前業(yè)界的AI開發(fā)平臺,問題是都相對場景單一,不夠全面。而ModelArts則率先做到了全生命周期開發(fā),可以支撐和管理AI開發(fā)當中的每一個環(huán)節(jié)。上面我們也說過,將割裂場景整合到一起,構成全生命周期AI開發(fā),是ModelArts倒逼解決慢與貴的核心優(yōu)勢。
這里有個問題值得注意,相信也是大家所關心的:顯然每個人都知道廚房更好用,不想去野地里做飯,那么為什么只有華為的ModelArts,在今天敢說自己是“全生命周期”?
我們或許可以這樣理解:在華為全棧AI體系剛剛發(fā)布48小時,ModelArts與視覺AI應用開發(fā)平臺HiLens、離線開發(fā)套件Atlas 200 、量子計算模擬器與編程框架HiQ四件套代表的AI開發(fā)平臺已經變成了第一個紅利級產品。事實上,ModelArts本身就是華為全棧AI體系的組成部分。與芯片、架構、AI使能平臺緊密相連,從而能夠一個場景跑通所有數據、訓練、推理的需要??梢哉f是剛剛發(fā)布的華為全棧AI,探出的第一根觸手。
其次,全生命周期的AI開發(fā),算力是一切的基礎。在昇騰芯片到來后,華為獲得了能夠組織大規(guī)模AI并聯算池的機會,從而可以保證全場景AI開發(fā)運行無阻。這里有一個環(huán)環(huán)相扣的AI推導邏輯。
再者,我們確實可以看到,今天無論是世界巨頭還是獨角獸公司。所推的AI開發(fā)平臺都是基于自身的業(yè)務考量。不會有公司推出一個與自己業(yè)務不想關,甚至自身能力之外的AI開發(fā)平臺。所以我們看到AI開發(fā)場景,依然是東一榔頭西一棒子的狀態(tài)。
而華為云,則是圍繞用戶為中心打造了AI開發(fā)平臺,以不讓開發(fā)者奔波為第一思路。并且確實認真看了哪些復雜可以留給自己,找到了很多關鍵矛盾的背后邏輯,并將之消解化。這歸因于華為的IT儲備優(yōu)勢,但更歸因華為云“復雜的歸自己”以及“解決實際問題”兩大核心理念。
對比之下,以往的AI開發(fā)平臺,更多是以自身產業(yè)利益為視角構建產品,而不是以開發(fā)者為出發(fā)視角,或者說不具備以開發(fā)者為中心,清掃問題的產業(yè)條件。
當全生命周期的AI開發(fā)平臺開始出現,本質上意味著某些AI產業(yè)的“黑歷史”將開始瓦解。無論是華為云還是其他品牌,很快會讓AI開發(fā)變成一個拼創(chuàng)意與想象力的游戲——而不是勞動力、資金成本與技術門檻相互競底的搞笑節(jié)目。
未來的某個時刻,我們會回想起那段AI開發(fā)能開“吐槽大會”的日子,后輩會覺得簡直不可思議,往事杯酒,幾成笑談。
但那時已經遍布AI的世界,卻并不會笑我們。因為從鉆木取火,到探索人工智能,歷史會記住每一位開發(fā)者都是偉大的。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉入資金提現免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
- 賽力斯發(fā)布聲明:未與任何伙伴聯合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。