哪些公司在做大模型?面對這個問題,我們首先會想到大型互聯(lián)網(wǎng)公司和AI創(chuàng)業(yè)公司。他們更多是做大模型算法本身,以及圍繞大模型的上層應用。
但順著這條產(chǎn)業(yè)鏈向下看,卻會發(fā)現(xiàn)在AI芯片與AI算法之間,還有非常關鍵的一層,這就是IT層。圍繞AI大模型的爆發(fā),產(chǎn)生了一系列存、算、網(wǎng)等IT設備升級,以及AI數(shù)據(jù)中心、私域大模型的市場需求。這些需求持續(xù)上漲,帶來了IT行業(yè)的又一次爆發(fā)。
所以,當我們在討論大模型產(chǎn)業(yè)鏈的時候,不能離開IT行業(yè)與IT企業(yè)。從2023年到現(xiàn)在,可以看到各個主要IT廠商紛紛出牌,搶灘大模型的新機會。這種趨勢將在2024年持續(xù)上升,產(chǎn)生更加激烈的市場競爭。
IT大廠面對大模型,首先是做產(chǎn)品,找切口,繼而開始形成連貫的智能化戰(zhàn)略。
本文中我們希望和大家一起讀懂,IT企業(yè)為何要搶灘大模型,又是如何實現(xiàn)這一戰(zhàn)略目標的。
走向第三春:大模型帶來的IT市場迭代
AI大模型的爆發(fā),客觀上給IT企業(yè)帶來了巨大的機會。這是由于傳統(tǒng)的IT設備,大多數(shù)都無法滿足AI大模型的訓練與部署需求。其中最知名的,就是AI需要專項算力。于是就產(chǎn)生了AI服務器這個全新的IT市場。再比如集群化AI訓練,需要對數(shù)據(jù)中心的網(wǎng)絡設備進行全面升級,以此來避免珍貴的AI算力在集群化過程中被浪費。
這些由大模型特殊性產(chǎn)生的IT設備迭代需求,伴隨著AI技術的爆發(fā)給IT市場格局帶來了顯著影響。比如,根據(jù)TrendForce此前發(fā)布的數(shù)據(jù),2023年全球AI服務器(包含搭載GPU、FPGA、ASIC等)出貨量應該可以達到120萬臺,年增長率高達38.4%,并且市場規(guī)模上將占到整體服務器市場出貨量的近9%。
如果這種情況持續(xù)下去,AI技術專項適配的IT設備,既是目前階段的增長爆發(fā)點,也可能是未來市場的主流需求。因此沒有IT廠商可以放棄大模型帶來的戰(zhàn)略契機。
回溯IT市場的發(fā)展歷史,行業(yè)內(nèi)經(jīng)常將過去劃分為早期IT市場的信息化時代,以及互聯(lián)網(wǎng)興起之后的數(shù)字化時代。那么伴隨著AI大模型的全面滲透,市場很可能將迎來IT第三春,也就是智能化時代。
在智能化契機的序曲當中,還有一條不能忽視的主線,那就是IT技術的國產(chǎn)化。尤其在2023年,伴隨著AI芯片禁令的反復炒作,AI算力國產(chǎn)化成為科技自主可控趨勢中的重中之重。
國產(chǎn)化意味著新需求。這一需求與AI大模型帶來的市場需求交融在一起,加重了這一輪IT市場迭代的分量。
面對走向IT第三春的可能,各個廠商紛紛開始尋找自己的AI市場切入口,同時注重提升自主可控AI產(chǎn)品的占比。
而分析IT廠商實現(xiàn)這一目標的戰(zhàn)略,我們可以將其歸納為以下三種。
以高度,贏廣度
IT廠商在切入大模型機遇時,首先要解決客戶信任的問題。AI相關的IT基礎設施選擇很多,且差異化較小,用戶試錯成本巨大。所以如何能夠與客戶建立技術及解決方案信任是關鍵。
破解這個難題,有這樣一種思路:廠商首先來把最核心、最難的事情完成,再通過核心市場來影響普及市場,形成以高打低,以高度贏廣度的市場格局。
而AI領域的核心任務有兩個。最復雜、龐大的基礎設施是AI計算中心,而最復雜的AI任務是AI for Science。
而在這兩個維度布局最深,并且已經(jīng)贏得口碑的,應該是中科曙光。
AI for Science為代表的“重型AI”需求,具有算力規(guī)模大、多元算力融合、服務需求水平高的一系列特點。為了切入這個領域,早在2022年曙光就完成了算力一體化平臺的開發(fā)及布局。依托各類算力中心,以原生的底層資源、市場化運營機制、開放生態(tài)體系,以及大量增值服務為支撐,為用戶提供集“算力、數(shù)據(jù)、應用、運營、運維”的一體服務。
這一戰(zhàn)略的代表性成果,就是曙光推出的5A級智算中心。在智算中心場景中,需要集中呈現(xiàn)廠商的技術、資源、生態(tài)、產(chǎn)學合作等AI行業(yè)要素。需要完成從技術投入到解決方案構建,再到運營支持、生態(tài)建設的一系列工作。因此在東數(shù)西算背景下,能夠獲得大量認可的智算中心,就會成為整個智能化IT生態(tài)中的戰(zhàn)略高地,滿足更多用戶對廠商AI技術能力與生態(tài)能力的信任。
陸續(xù)建設并投入使用的5A智算中心,也就成為曙光在切入AI機遇時的高點。廣泛帶動了曙光在AI服務器、存儲等領域的發(fā)展。同時,曙光在AI for Science的積極布局與成功經(jīng)驗,也成了其持續(xù)挺進AI機遇時的核心差異化要素。
目前來看,“以高帶廣”是IT廠商走進智能時代一個行之有效的策略。
以算法,帶設備
相較于互聯(lián)網(wǎng)企業(yè)與AI公司,更多有IT需求的企業(yè)其實并不了解AI,同時也很難探索滿足自身業(yè)務需求的大模型落地方案。這也就導致更廣泛的客戶難以向AI方向轉化。為了解決這個問題,在2023年我們看到了IT廠商開啟了一種比較超越常規(guī)的探索:自己做AI大模型,并且開源。
去年11月,浪潮信息對外發(fā)布了完全開源且可免費商用的源2.0基礎大模型。這個系列的AI大模型包含1026億、518億、21億等不同的參數(shù)規(guī)模。對外稱為是國內(nèi)首個千億參數(shù)、全面開源的大模型。在能力應用上,源2.0大模型可以執(zhí)行多種任務,比如數(shù)理邏輯、代碼生成、知識問答、中英文翻譯、理解和生成等。
作為硬件供應商的IT企業(yè),去做純軟件的開源大模型,似乎是一件打破常規(guī)的事。但在浪潮信息的動作中,我們卻可以看到這個策略在“打開AI機遇切口”上的合理性。
首先,訓練大模型的基礎是硬件能力,尤其是算力能力。同時也會展現(xiàn)出廠商對軟硬件適配能力的理解。比如說在算力層面,源2.0就采用了非均勻流水并行的訓練方法,綜合運用“流水線并行+優(yōu)化器參數(shù)并行+數(shù)據(jù)并行”的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現(xiàn)顯存瓶頸導致的訓練效率降低的問題。這個方法為硬件差異較大的環(huán)境提供了新的訓練方式。這樣的經(jīng)驗展現(xiàn)、路徑探索,可以幫助IT廠商更緊密了解客戶的IT環(huán)境與AI訓練需求,從而提供準確的產(chǎn)品及服務。而對于用戶來說,先看懂廠商如何做算法,也可以有效指導自身的AI算法嘗試,從而可以推動嘗試與客戶間的AI合作關系。
另一方面,IT廠商推出開源且可免費商用的大模型,等于將大量潛在客戶的算法應用門檻降到最低,讓他們可以開始嘗試大模型。而在嘗試成功之后,客戶也自然會更傾向于開源模型背后,原廠提供的IT設備,從而實現(xiàn)了以軟件帶動硬件的市場策略。
這種策略能否收獲積極的市場反饋,在2024年引起行業(yè)的效仿和跟隨,讓我們拭目以待。
以全棧,降門檻
在IT行業(yè)中,企業(yè)需要堅持產(chǎn)品和解決方案兩條腿走路的策略。前者主攻出貨量,而后者可以帶來更為可觀的利潤空間。
而在AI大模型機遇到來時也是如此。相對來說,本身AI能力較強,應用相對成熟的企業(yè)會考慮購買AI相關的存、算、網(wǎng)IT產(chǎn)品。但更多的企業(yè)則沒有強大的AI能力,但又對智能化能力有著需求和期待。這種情況下,就需要IT企業(yè)以解決方案的模式進行AI能力交付,從而降低企業(yè)的AI大模型門檻。
這也就引出了IT廠商入局大模型的第三種思路:發(fā)揮自身的全棧技術優(yōu)勢,提升解決方案交付能力。在降低企業(yè)AI應用門檻的前提下,獲得更好的商業(yè)回饋。
這一點,可以說是IT廠商面對大模型機遇時的普遍選擇。各家都是重兵投入,集結力量。一般來說,AI大模型相關的硬件設備有算力、存儲、網(wǎng)絡和商用終端,而在硬件基礎上還有AI開發(fā)平臺、管理平臺、私域大模型等軟件能力。在這各個領域有廣泛布局的IT廠商,也就有了擁抱大模型機遇的更大底氣。
比如說,新華三面向AI大模型機遇,打造了百業(yè)靈犀LinSeer私域大模型,定位是為企業(yè)用戶提供定制化服務的私域大模型??梢蕴峁┵Y料分析、代碼編寫等服務,覆蓋了政府政務、工業(yè)制造等諸多領域。百業(yè)靈犀LinSeer私域大模型,可以與新華三此前的一系列AI布局進行結合,比如訓練型智算服務器、推理型智算服務器、綠洲平臺、傲飛算力平臺、無損網(wǎng)絡,高性能存儲、液冷解決方案等,能夠綜合性幫助客戶一站式部署智算底座,快速搭建AI場景化應用。
這種盡量發(fā)揮自身全棧技術優(yōu)勢,打通AI大模型所需軟硬件底座的模式,在很多IT廠商的最新動作中都有展現(xiàn)。比如聯(lián)想推出的大模型解決方案及服務,就包括智算中心、AI平臺、AIforce的“三位一體”。面向私域大模型市場,聯(lián)想也推出了幫助企業(yè)構建私有化大模型平臺的服務,其依托于一站式端到端的解決方案與陪伴式服務,讓客戶不必考慮部署細節(jié),就可以快速獲得大模型能力。這一解決方案的建立,也融合了聯(lián)想在IT基礎設施、IT服務、AI force平臺,以及智能終端領域的多種能力。
這種盡量將自身產(chǎn)業(yè)優(yōu)勢結合,形成整體性解決方案,從而提供低門檻AI獲取方式的能力,是IT企業(yè)切入大模型機遇核心策略。比如我們可以看到新華三在切入大模型領域時,就將自身在網(wǎng)絡、液冷等方面的優(yōu)勢融合進來。而聯(lián)想則將自身在商用終端、AI能力平臺上的積累納入整體方案。
這種通過能力融合來構建差異化的策略,將在接下來IT廠商布局AI業(yè)務時展現(xiàn)得更加清晰。
整體來看,IT廠商搶灘大模型,是一種綜合能力的考驗,同時也需要廠商有調(diào)動、整合的能力,從而實現(xiàn)高舉高打的系統(tǒng)性戰(zhàn)略。
在這個過程中,有三個要素尤為關鍵。
一是廠商能否將多元化的布局協(xié)同起來,通過能力整合發(fā)揮出自身獨特的AI優(yōu)勢。
二是能否實現(xiàn)軟件側對硬件側的補充,甚至通過軟件創(chuàng)新反哺IT基礎設施市場。
三是技術自研以及全面國產(chǎn)化的能力,這點將在科技自主可控的浪潮中不斷變得更加重要。
可以說,IT行業(yè)的AI迭代與智能化競賽,才剛剛拉開序幕。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。