2023年的春天,稱得上一句AI之春。大模型成為技術力量新的爆發(fā)點,生成式AI(AIGC)應用風起云涌。
產(chǎn)業(yè)界爭先恐后訓大模型之際,廣大用戶最大的困惑是——發(fā)布了,但就是玩不到?。?/p>
OpenAI有地域限制且不去說它,各種國產(chǎn)大模型也很少有大大方方讓大家隨便用的,排隊等邀請碼、群里求測試賬號、不開放API、只定向邀請企業(yè)客戶、上線沒幾天停止訪問……
過去幾個月,想用AIGC的人,沒少受這些折磨。
當然,這種局面也不能怪大模型的開發(fā)運營團隊,實在是“心有余而力不足”——AI算力太緊缺了。
想開發(fā)大模型的高校和研究機構,搶不到、買不起GPU卡;已經(jīng)發(fā)布的大模型,用戶暴漲,導致算力需求的指數(shù)級增長和巨大的成本壓力,撐不住訪問。
就像保爾·芒圖在《十八世紀產(chǎn)業(yè)革命》中說的那樣:“經(jīng)濟演變是比較混亂的,好像撒在大地上的種子那樣慢慢生長。無數(shù)模糊不明的事實,在細節(jié)上幾乎是微不足道的,但彼此無限地相互改變著”。
新型AI算力基礎設施,就是那個至關重要的細節(jié),直接影響到這次智能產(chǎn)業(yè)革命的進程。
在諸多解決方案中,新華三的破題思路,別具特色,一言以蔽之——精耕務實。
首先讓我們先從算力本身出發(fā),去看看大模型時代的AI奮鋤者,究竟需要什么?又能得到什么?
晨興理荒穢:算力土壤,為何貧瘠?
AIGC的價值潛力已經(jīng)十分明晰,讓大模型成了各大科技企業(yè)爭相搶奪的那顆“好苗子”。
陶淵明描寫古人耕種要“晨興理荒穢,帶月荷鋤歸”,先摘除阻礙作物生長的雜草,才能保障后續(xù)的收成。
所以,首先要搞清楚一個問題,為什么AI算力顯得如此貧瘠?
第一,供給不足。受摩爾定律達到天花板的影響,計算硬件的性能提升越來越有限,AI算力短缺問題長期存在,大模型又進一步加劇了算力焦渴。以176B參數(shù)規(guī)模的大模型為例,F(xiàn)P16精度下,訓練過程內存峰值會達到2800G+,需要35張以上80G顯存的GPU才能容納。很多國內高校,有AI人才、技術積累,想要探索大模型,卻買不到、買不起GPU卡,止步于昂貴的AI算力門檻,是非??上У?。
第二,需求溢出。大模型和生成式AI(AIGC)的出現(xiàn),微軟、谷歌、百度等科技巨頭,都在用AI重新構想所有的核心產(chǎn)品。技術的快速溢出,算力基礎設施沒有來得及跟上,造成了AI算力供需的不匹配。隨著AIGC擴展到每個領域,越來越多的智力勞動逐步被AI化、自動化,算力供需的“剪刀差”,還會繼續(xù)拉大。
第三,效率低下。企業(yè)/科研機構對模型開發(fā)和AI全域應用的不了解、不高效,會直接導致準備不充足,比如訓練數(shù)據(jù)質量低、AI應用開發(fā)經(jīng)驗不足、資源損耗大;研發(fā)周期長,比如大模型研發(fā)慢、推理效果差,不得不反復迭代試錯,也就消耗了更多的時間成本、算力成本。
第四,安全隱患。數(shù)據(jù)是模型核心的原材料,企業(yè)私域數(shù)據(jù)更是企業(yè)的核心資產(chǎn)。企業(yè)的大模型如果使用不當,會存在企業(yè)私域數(shù)據(jù)泄露的風險,造成企業(yè)即便擁有大量算力也不敢放心使用。
第五,可持續(xù)顧慮。“焚藪而田,豈不獲得,而明年無獸”,這個道理同樣適用于大模型時代。大模型的數(shù)據(jù)處理量巨大,帶動數(shù)據(jù)中心耗電量快速增加。GPT-3大模型每次訓練,碳排放量高達552噸。中國大模型和AIGC的發(fā)展,必須建立在綠色節(jié)能的算力基礎設施上,“東數(shù)西算”工程就為各地新建數(shù)據(jù)中心PUE,提出了嚴格的要求。
面對AI算力貧瘠的局面,干著急是沒有用的,唯有靠勞作者揮鋤挖地,為行業(yè)理清荒穢,釋放算力這一新生產(chǎn)力。
迎著大模型和AIGC的晨光,新華三已經(jīng)開始培育AI的土壤。
精耕細作:新華三蘊育全棧AI
“算力不足,那就增加供給,堆GPU卡,上服務器,建數(shù)據(jù)中心集群”——這是常規(guī)思路。
新華三的AI蘊育之路沒這么簡單,在剛剛落幕的2023 NAVIGATE 領航者峰會上,新華三正式發(fā)布了“百業(yè)靈犀LinSeer”私域大模型和支持AIGC大算力調度的“傲飛算力平臺”,可與業(yè)務深度結合提升工作效率,持續(xù)優(yōu)化算法和積累公域數(shù)據(jù),為客戶提供最新知識能力。同時推出了“AIGC開放戰(zhàn)略”,既支持“百業(yè)靈犀+新華三ICT基礎架構”的模式保障數(shù)據(jù)安全,實現(xiàn)最優(yōu)配合,同時也支持“客戶自選大模型+新華三ICT基礎架構”的模式滿足多種需求。
新華三如此用心耕耘,這么多的復合能力,究竟能為這一波AI浪潮帶來什么?
第一步,培土,讓大模型“用有其算”。
解決算力瓶頸,提供充足、普惠且安全的AI算力,支持高校、科研機構和廣大企業(yè)的充分探索,大模型和AIGC才有茁壯生長的可能性,靠的就是新華三智算解決方案的“算力基礎設施”,有三個顯著特點:
充足。新華三對基礎設施進行優(yōu)化,讓硬件發(fā)揮出極致性能。打造了超高性能AI服務器,強勢推出H3C UniServer R5500 G6,可以提供8卡H800 OAM訓練能力,內部互聯(lián)400Gb/s極速網(wǎng)絡,支撐大模型的高效訓練。CX8000高性能分布式并行文件存儲,專為AI訓練研發(fā),單節(jié)點IOPS可達20萬+,可以滿足AI超大規(guī)模數(shù)據(jù)對存力的需求。Seerfabric軟硬一體方案,通過跟AI深度融合,實現(xiàn)流量零丟包,發(fā)揮RoCE網(wǎng)絡最大性能,大模型訓練時間縮短10%,配合主動安全全面防護,為上層平臺和應用提供安全、高效的算力支撐。
普惠。模型開發(fā)部署的過程中,通過傲飛算力平臺共享AI算力,降低算力空閑時間,可以將算力利用率提高至70%以上,智算中心成本大幅下降,提供普惠AI算力。
安全。避免大模型服務使用時造成的數(shù)據(jù)外泄是企業(yè)放心使用大模型的重要前提。新華三智算解決方案通過4大安全體系:傳輸安全+數(shù)據(jù)安全+訪問安全+安全審計,保障用戶使用私域大模型的同時,全方位保障私域數(shù)據(jù)安全,避免企業(yè)私域數(shù)據(jù)出域。
綠色。新華三的零碳數(shù)據(jù)中心,將各綠色單元組合起來,降低高算力帶來的碳排放問題;新一代液冷解決方案,可以將數(shù)據(jù)中心的PUE降到1.1及以下,滿足國家對數(shù)據(jù)中心的低碳要求,帶來綠色算力。
第二步,護苗,讓大模型“算有其法”。
從來沒有下過地的新手,很容易就糟蹋了種苗,浪費了土地,更重要的是,錯過了農(nóng)時。
大模型作為新技術,很多參與者都是剛開始接觸,要抓住寶貴的產(chǎn)業(yè)機會,必須有章法。新華三不僅提供“土壤”,還精心“護苗”,為大模型的成長、應用,帶來了全鏈路的平臺和服務。
平臺層面,統(tǒng)一的數(shù)據(jù)平臺“綠洲”,可有效進行數(shù)據(jù)全生命周期管理;支持AIGC的大算力調度平臺“傲飛”,提供包含智能標注、智能訓練、智能調優(yōu)、智能部署、智能推理的全流程算力智能調度,支持8000節(jié)點的算力調度,并發(fā)訓練時間縮短至50%,斷點自動接續(xù)無感知訓練更穩(wěn)定,全方面提升大模型訓練性能。
服務層面,針對大模型預訓練/微調、強化學習、提示學習等特點,新華三根據(jù)自身大模型實踐經(jīng)驗,封裝了推理、微調、訓練這三種大模型服務能力,降低大模型使用門檻。
比如基座大模型推理,對推理架構/執(zhí)行/過程進行優(yōu)化,并提供配套基礎設施,可以為科研工作者構建AI科研環(huán)境,滿足數(shù)據(jù)挖掘分析、模式識別等需求。新華三的“傳輸安全+數(shù)據(jù)安全+訪問安全+安全審計”4大安全體系,可以在私域大模型的訓練推理過程中,保障企業(yè)數(shù)據(jù)資產(chǎn)的安全不外流。
私域大模型微調,新華三的10+種基座大模型,結合微調優(yōu)化,可以助力企業(yè)快速打造垂直領域私域大模型,實現(xiàn)小時級生成。
自主大模型訓練,提供100多個評估維度與評估指標,如BLEU、ROUGE、METEOR等,有效縮短模型的研發(fā)周期。
接下來,孕蕾,讓大模型“算有所值”。
大模型和AIGC要通過產(chǎn)業(yè)落地,來完成技術的價值轉換。要結出更多的應用果實,前提是與百行百業(yè)開始連接、探索落地業(yè)務場景、孕育應用的花蕾。
這個“傳花授粉”的過程,僅靠單一的產(chǎn)業(yè)角色是無法完成的。新華三構建了一個開放的產(chǎn)業(yè)生態(tài),吸引合作伙伴參與到大模型建設中,共同蘊育全棧AI的無限潛力。
全棧AI的生態(tài)繁榮,才有大模型的碩果累累,技術紅利的價值落地。
可以看到,正是新華三的精耕細作、用心栽培,大大降低了大模型和AIGC的發(fā)育難度。
借助新華三的智算解決方案,越來越多的研究者/企業(yè),可以從算力焦灼中解放出來,抓住寶貴的增長窗口期,培育屬于自己的大模型。
由此,可以引出下一個話題:與時代同步,培育大模型“土壤”,為什么是新華三?
實地立身:新華三的根深,大模型的葉茂
大模型和新型智能基礎設施,是第四次產(chǎn)業(yè)革命的關鍵,也是數(shù)字經(jīng)濟的大勢所趨,坦率地說,這個產(chǎn)業(yè)趨勢是顯而易見的。
但是,看到趨勢,并不一定能抓住趨勢。
大模型和AIGC等新技術的發(fā)展與應用,相當于在一片晨霧和產(chǎn)業(yè)荒原中摸索。算力基礎設施服務商,不可能“以其昏昏,使人昭昭”,自己都沒搞懂大模型和AIGC,自然沒法賦能研究者和高科技企業(yè)。
能構建一套清晰可行的智算解決方案,新華三的優(yōu)勢就是“腳踏實地”。
首先,新華三的技術根深,可以構筑新價值。
深耕ICT領域,承擔AI領域科研課題的新華三,技術能力與產(chǎn)品積累非常深厚,布局廣泛,能夠為全棧AI技術、軟硬件和服務,提供持續(xù)創(chuàng)新的動能。
此外,新華三的創(chuàng)新務實,可以解決真問題。
大模型時代的技術變化和產(chǎn)業(yè)應用日新月異,各行業(yè)的落地條件和能力稟賦也有所不同,這就要求基礎設施服務商對變化有深刻且快速的洞察,才能確保每個行業(yè)/產(chǎn)學研各類用戶的需求都得到滿足。
作為數(shù)字化解決方案領導者,新華三有豐富的服務實體產(chǎn)業(yè)經(jīng)驗,可以及時洞察產(chǎn)業(yè)客戶的需求,進行技術和產(chǎn)品的更新迭代,讓每一個創(chuàng)新都能切實解決用戶在意的真問題。
智算解決方案中,普惠算力,高效易用的平臺,軟硬拉通的服務等,都來自產(chǎn)業(yè)用戶在業(yè)務場景中成本敏感、效率優(yōu)化等實際痛點。
回頭對比一下幾年前的生活,會發(fā)現(xiàn)AI技術已經(jīng)在切實影響、改變我們的社會經(jīng)濟。大模型的到來,讓智能變革繼續(xù)加速,最終每個人、每個行業(yè)乃至每一個國家,都會是人工智能的參與者和受益人。
產(chǎn)業(yè)智能革命的土壤,從未像今天一樣肥沃。在新華三的基礎設施底座上,大模型這顆種子,正在茁壯生長。接下來,就看百行百業(yè)如何釋放大模型的無限想象,將AIGC的碩果垂?jié)M中華。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。