大模型的創(chuàng)新,不僅僅需要單點的創(chuàng)新,更要圍繞AI-Native開展系統(tǒng)性地創(chuàng)新;不僅要在場景上廣泛探索,更要在技術(shù)上形成突圍。
重塑一切的理想主義AI
大模型已成為當(dāng)下IT產(chǎn)業(yè)無可爭議的最大風(fēng)口。
人工智能從概念提出至今已有半個多世紀(jì),繼“深藍(lán)”和AlphaGo曇花一現(xiàn)之后,Transformer架構(gòu)及ChatGPT的橫空出世,再一次點燃全世界的熱情,人工智能以更具象、接地氣的方式呈現(xiàn),大模型和生成式AI也開始走入更多人的視野。
過去的一年來,從互動問答、語音對話到文生視頻,OpenAI屢次刷新熱度;Google、Meta入局推出開源大模型,圖謀一席之地;微軟將GPT4.0集成到辦公軟件中,成為生產(chǎn)力工具;華為和蘋果將手機語音助手接入大模型,加速端側(cè)智能化。
AI產(chǎn)業(yè)的拐點已經(jīng)來到,大模型正在重塑一切辦公、生產(chǎn)和生活。
大模型火熱的背后,英偉達(dá)成為最大的受益方。隨著業(yè)界對AI算力的需求快速增長,GPU卡洛陽紙貴、一卡難求,其24/25Q1季報同比增長近4倍,達(dá)到260億美金。受持續(xù)提升的業(yè)績數(shù)據(jù)和不斷放大的市場需求支撐,2024年6月18日英偉達(dá)市值達(dá)到3.35萬億美金,連續(xù)超越微軟、蘋果,成為全球市值最大的公司。
一切都在向著人們期待的方向發(fā)展,甚至有人喊出了“第四次工業(yè)革命已來”。
盛名之下,其實難副
這波大模型浪潮并不如表面呈現(xiàn)的那樣光鮮亮麗,幾家歡喜幾家愁。
根據(jù)紅杉資本發(fā)布的報告,英偉達(dá)僅在2023年的芯片訂單就高達(dá)500億美元,賺得盆滿缽滿,而整個生成式AI企業(yè)的銷售收入才30億美元,多數(shù)企業(yè)距離盈利依然遙遙無期,甚至一些企業(yè)已經(jīng)瀕臨破產(chǎn)的邊緣。
如果淘金者持續(xù)淘不到金子,賣鏟子的生意也終將不可持續(xù)。
不管是OpenAI、微軟還是谷歌,這些AI的先行者都還沒有找到穩(wěn)定且持續(xù)的商業(yè)模式,更多的是為資本描繪了一副宏大的藍(lán)圖,以支撐市場的預(yù)期。
在國內(nèi),10億參數(shù)規(guī)模以上大模型數(shù)量已遠(yuǎn)超100個。但還未形成成熟商業(yè)模式的大模型產(chǎn)業(yè),已經(jīng)開始卷起了價格,模型免費、Token降價、算力打折,多么熟悉的味道。在群雄混戰(zhàn)的早期通過低價圈定一波用戶和開發(fā)者無可厚非,適當(dāng)?shù)母偁幱欣诋a(chǎn)業(yè)的良性發(fā)展,但無序的競爭將導(dǎo)致惡性循環(huán),讓大模型產(chǎn)業(yè)陷入死亡螺旋。
2023年底,Gartner發(fā)布AI新興技術(shù)成熟度曲線,大模型和生成式AI正處在技術(shù)炒作周期的最高點,Gartner對生成式AI做出了極高的評價,認(rèn)為它將AI的熱度推向了一個新高潮,但也表達(dá)了對繁榮之下所掩蓋的潛在風(fēng)險的擔(dān)憂。
市場最終要回歸理性,只有真正為用戶創(chuàng)造價值才能實現(xiàn)商業(yè)閉環(huán)、有更長遠(yuǎn)未來。
理想很豐滿,現(xiàn)實很骨感!大模型從趨勢到全面落地依然任重道遠(yuǎn)。
化整為零,圍繞行業(yè)穿插作戰(zhàn),實現(xiàn)戰(zhàn)略突圍
在這一波AI浪潮中,中國發(fā)展得怎么樣?當(dāng)網(wǎng)絡(luò)上ChatGPT、Sora、英偉達(dá)的新聞鋪天蓋地襲來時,很多人不免產(chǎn)生焦慮:我們又落后了?
必須承認(rèn),我國在算力、算法和數(shù)據(jù)領(lǐng)域其實并不具備優(yōu)勢:高端算力卡被英偉達(dá)卡脖子無法供應(yīng),短時間內(nèi)自有制程和設(shè)計又無法跟上;算法領(lǐng)域,雖然模型數(shù)量眾多,但大多數(shù)是基于國外開源架構(gòu)優(yōu)化,缺乏自主性和領(lǐng)先性;數(shù)據(jù)領(lǐng)域,我們的開放數(shù)據(jù)和國外不在一個數(shù)量級上,中文語料嚴(yán)重不足。
AI的三要素,每一條都是致命傷!
但從另一個角度看,我國有全球唯一的全工業(yè)門類、最多的金融消費人群以及最大規(guī)模的政務(wù)和城市體系,產(chǎn)生了豐富的場景和私有數(shù)據(jù),這些都成為發(fā)展行業(yè)大模型的天然土壤。于是,我們沒有走大兵團正面突擊的道路,而是化整為零圍繞行業(yè)穿插作戰(zhàn),通過大模型賦能一個個行業(yè)細(xì)分場景,最終形成戰(zhàn)略突圍。
近兩年,在用戶和廠商的共同努力下,一些行業(yè)大模型已經(jīng)開花結(jié)果。大模型已經(jīng)逐步應(yīng)用政務(wù)導(dǎo)辦、公文檢索、事件分撥等場景,幫助政府提升政務(wù)服務(wù)效率和城市管理效率;在礦山領(lǐng)域,大模型和云邊協(xié)同幫助礦山實現(xiàn)增安提效,加速產(chǎn)業(yè)集群智能化;在鐵路,基于視覺大模型的TFDS火車故障軌邊圖像檢測系統(tǒng),實現(xiàn)不停車的實時圖像采集和分析,自動識別各種不同類型的鐵路貨車故障;基于大模型的氣象預(yù)測方案,計算速度相比傳統(tǒng)HPC的數(shù)值計算提升一萬倍,更精準(zhǔn)預(yù)測臺風(fēng)路徑。
還有醫(yī)藥、制造、鋼鐵、金融等更多行業(yè)的場景在持續(xù)落地,我們正在走一條和國外不一樣的務(wù)實之路,不跟風(fēng)不冒進(jìn),沿著清晰的目標(biāo)和節(jié)奏逐個打磨場景,這種涓涓細(xì)流,終將匯聚成智能化的汪洋大海。
行業(yè)大模型加速落地建議
行業(yè)大模型建設(shè),知易行難。
政企業(yè)務(wù)場景復(fù)雜多樣,很難用通用大模型去應(yīng)對。此時我們應(yīng)該意識到,卷參數(shù)量、卷Token數(shù)、卷集群規(guī)模、卷價格都毫無意義,行業(yè)大模型落地更需要關(guān)注工程化的問題。
一、軟硬協(xié)同發(fā)展
除了模型本身外,大模型還涉及開發(fā)平臺、開發(fā)框架、計算架構(gòu)以及各類工具,以及多樣性算力、高性能存儲和高帶寬網(wǎng)絡(luò)等硬件基礎(chǔ)設(shè)施。在分層解耦架構(gòu)的基礎(chǔ)上,需要從性能、可靠性、可維護性以及兼容性等方面,進(jìn)行端到端的集成設(shè)計和驗證。比如軟硬件全鏈路可視化運維、算網(wǎng)協(xié)同的低時延大帶寬網(wǎng)絡(luò)、基于親和性的算子加速等,確保系統(tǒng)不僅跑得好,更要跑得穩(wěn)。
二、采用AI-Native的云基礎(chǔ)設(shè)施
AI-Native的云基礎(chǔ)設(shè)施正成為越來越多企業(yè)的優(yōu)先選擇。基于公有云訓(xùn)練基礎(chǔ)大模型,在本地私有云中結(jié)合私有數(shù)據(jù)通過二次訓(xùn)練和微調(diào),這種混合云方案兼顧效率與安全,已成為大模型建設(shè)的新范式,同時云邊協(xié)同的架構(gòu)還可以有效簡化海量邊緣的管理,應(yīng)對工業(yè)場景海量邊緣接入的需求。它相比非云的部署模式,還能提供對通用算力和AI算力的統(tǒng)一調(diào)度,并基于其豐富技術(shù)棧覆蓋數(shù)據(jù)、模型和應(yīng)用開發(fā)全流程,降低開發(fā)門檻。
三、建立AI開發(fā)工作流,促進(jìn)模型確定性交付
大模型是一個系統(tǒng)工程,其交付過程涉及數(shù)據(jù)管理、模型開發(fā)環(huán)境、模型訓(xùn)練、推理部署的全流程數(shù)十個環(huán)節(jié),傳統(tǒng)的開發(fā)機制很難解決跨團隊協(xié)作和迭代開發(fā)的難題。要降低模型開發(fā)過程的不確定性,需要建立一站式AI開發(fā)工作流,幫助企業(yè)快速構(gòu)建跨團隊協(xié)同開發(fā)、高效迭代的機制,同時通過標(biāo)準(zhǔn)化、自動化的流程提高模型的交付效率與交付質(zhì)量。
四、重視數(shù)據(jù)工程,打造優(yōu)質(zhì)數(shù)據(jù)集
模型性能是由數(shù)據(jù)質(zhì)量和算法設(shè)計共同決定的,當(dāng)前AI訓(xùn)練數(shù)據(jù)缺乏系統(tǒng)化的治理工具,甚至部分工作需要人為處理,存在集成、清洗和標(biāo)注效率低,以及價值觀的問題。打造高質(zhì)量的AI大模型,必須構(gòu)筑核心的數(shù)據(jù)工程能力,為大模型高質(zhì)量供數(shù)。一方面可以借助開放的數(shù)據(jù)授權(quán)運營平臺,獲取高質(zhì)量的數(shù)據(jù);另一方面,針對內(nèi)部數(shù)據(jù)需要引入自動化和智能化的手段,構(gòu)建數(shù)據(jù)清洗、標(biāo)注和質(zhì)量評估體系;同時通過數(shù)據(jù)質(zhì)量分析、成分分析、場景配比和智能配比能力,建立數(shù)據(jù)配比到模型效果的反饋優(yōu)化機制,基于應(yīng)用效果反饋持續(xù)調(diào)優(yōu),實現(xiàn)價值觀對齊。
五、建立賦能機制,繁榮產(chǎn)業(yè)生態(tài)
生態(tài)是發(fā)展大模型不可或缺的一環(huán)。需要從技術(shù)生態(tài)、數(shù)據(jù)生態(tài)、模型生態(tài)和應(yīng)用生態(tài)四個層面,去構(gòu)建AI時代開放、可閉環(huán)、有質(zhì)量的生態(tài)體系。這個過程中,政府和行業(yè)頭部企業(yè)的作用不可忽視,可以帶頭建立如聯(lián)創(chuàng)實驗室、模型和應(yīng)用商城、需求對接會、創(chuàng)新大賽等,并通過資金贊助、人才培養(yǎng)、政策扶持等多方面的牽引,通過行政手段打造中立的區(qū)域性賦能平臺;行業(yè)頭部企業(yè)在開展自身業(yè)務(wù)創(chuàng)新的同時,也可以通過技術(shù)、數(shù)據(jù)、模型和應(yīng)用賦能行業(yè)和產(chǎn)業(yè)鏈上下游,從單企智能化走向行業(yè)智能化。
六、開展持續(xù)運營
大模型落地面臨缺經(jīng)驗、缺人才、缺能力的挑戰(zhàn),大多數(shù)企業(yè)都是邊實踐、邊總結(jié)。需要將這些經(jīng)驗和能力固化下來,逐步形成覆蓋了大模型落地的全流程的工程能力,包括前期的頂層設(shè)計、POC測試、規(guī)劃實施,中期構(gòu)建優(yōu)質(zhì)數(shù)據(jù)集、開展場景分析和模型開發(fā),以及后期的運維運營等。大模型運營和建設(shè)同樣重要,缺少運營機制,大模型平臺很難持續(xù)發(fā)揮價值。因此,需要打造適合企業(yè)的流程、組織和人才隊伍,持續(xù)開展技術(shù)、生態(tài)、用戶運營,不會斷優(yōu)化老場景、發(fā)掘新場景,最終實現(xiàn)全面智能化。
欲木之長者,必固其根本
大模型創(chuàng)新,歸根結(jié)底是技術(shù)之爭,根深才能葉茂。
大模型的創(chuàng)新,不僅僅需要單點的創(chuàng)新,更要圍繞AI-Native開展系統(tǒng)性地創(chuàng)新,不僅要在場景上廣泛探索,更要在技術(shù)上形成突圍。
近年來,國內(nèi)涌現(xiàn)了一批代表性的科技企業(yè),如寒武紀(jì)、地平線、壁仞科技、訊飛、摩爾線程、華為、阿里、百度等,他們堅持投入人工智能創(chuàng)新,推動AI產(chǎn)業(yè)升級。
2023年,百度 “文心一言”、阿里 “通義千問”和訊飛 “星火”陸續(xù)推出,華為也發(fā)布盤古大模型3.0,提出“AI for industries”的理念,并基于華為云Stack推出了業(yè)界首個大模型混合云。近期HDC2024上,華為云盤古大模型5.0升級亮相,打造全系列、多模態(tài)和強思維能力,進(jìn)一步詮釋“解難題、做難事”的愿景,同時發(fā)布大模型混合云十大創(chuàng)新技術(shù),通過AI-Native的系統(tǒng)性創(chuàng)新,加速企業(yè)專屬大模型落地。
創(chuàng)新者往往孤獨,但注定不凡。
不僅需要沉下心,更要有“板凳要坐十年冷”的戰(zhàn)略耐性。
我們終將迎來AI的黃金時代。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 生成式AI云上創(chuàng)新,“全棧聯(lián)動”將成關(guān)鍵詞?
- 大模型進(jìn)化論:AI產(chǎn)業(yè)落地將卷向何方?
- 2024年劇集氪金力大盤點
- “共創(chuàng)”、“造?!背身斄?,傳統(tǒng)品牌緣何要花式出圈?
- 人形機器人瘋狂進(jìn)廠打工!銀河通用、智元、樂聚機器人怕是都瘋了
- 因為送禮電商!2025微信、抖音、淘寶又撕破了臉
- 中國手機市場成績單:華為增長最快,蘋果跌幅最大
- 原以為微軟、亞馬遜、阿里云云計算大局已定!沒想到有這四大變數(shù)
- 崖州灣之旅:看見海與智能,聯(lián)想到了未來
- 榮耀換帥,一艘AI巨輪的舵手更替會帶來什么?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。