每隔一段時間,都會重讀一遍梁啟超先生的《少年中國說》。
在向科技要答案的時代,在技術(shù)創(chuàng)新愈發(fā)可貴的時代,這篇我們都學(xué)過的文章中蘊含著極大的價值。比如,其中說“使舉國之少年而果為少年也,則吾中國為未來之國,其進步未可量也”。每一項技術(shù)都是初生的少年,但這些技術(shù)創(chuàng)新真的有少年心氣嗎?
我們的技術(shù),是否真正心懷寬廣,愿意進行根技術(shù)的全棧創(chuàng)新?
我們的技術(shù),是否愿意走出家門,步履四方,去了解應(yīng)用場景,去洞察行業(yè)需求?
我們的技術(shù),是否能與大勢相結(jié)合,承擔起自己的時代責任?
在大模型掀起的新一輪全球AI熱潮中,這些問題的答案變得尤其重要。幾個月以來,中國已經(jīng)陸續(xù)發(fā)布了數(shù)十款大模型。但總有網(wǎng)友在問這樣一個問題:中國做了這么多大模型,究竟有什么不一樣?
我們是該堅持“人有我也有”的老成穩(wěn)重,來亦步亦趨做AI ,還是要積極與這片土地結(jié)合,做出“人無我有”的新智能?
如果你的答案也是后者,那么盤古大模型3.0值得了解一下。
在7月7日舉辦的華為開發(fā)者大會2023(HDC.Cloud 2023 )期間,華為云發(fā)布了盤古大模型3.0。與其他AI大模型不同的是,華為云選擇去到行業(yè)原野里,寫一篇「少年AI說」。
AI大模型,需要一些少年氣
梁啟超在《少年中國說》里諷刺了一種暮氣沉沉的現(xiàn)象,“雖轟雷盤旋其頂上,他事非所顧也,非所知也,非所聞也”。
技術(shù)創(chuàng)新中,經(jīng)常也會陷入類似狀況:一項技術(shù)火了,大家就一擁而上,只要能夠做出差不多能夠交差的東西就行。在第三次AI崛起已經(jīng)超過十年的今天,這種暮氣已經(jīng)顯現(xiàn)出來。比如說,AI大模型通用性好,泛化性強已經(jīng)成為產(chǎn)業(yè)共識。但大模型的應(yīng)用,目前還處在比較傳統(tǒng)的軌道上——寫寫詩,答答題,跑跑分,刷刷紀錄。模式上看,這與深度學(xué)習(xí)十年來的應(yīng)用邏輯只有量變,缺乏質(zhì)變。
當大模型遇上如火如荼的數(shù)字中國建設(shè),無數(shù)企業(yè)會問:亭臺樓閣中的大模型很好,但我的行業(yè)為什么用不到?
中國大模型想要發(fā)展,必須要直面并回答這個問題。
綜合來看,目前產(chǎn)業(yè)與大模型結(jié)合的門檻依舊很高,集中表現(xiàn)為以下幾個方面:
1.AI技術(shù)本身門檻高,成本高。從算力成本、數(shù)據(jù)成本、開發(fā)成本、人才成本多方面,企業(yè)應(yīng)用AI并不容易,這為大模型落地造成了基礎(chǔ)阻礙。
2.數(shù)據(jù)安全和基礎(chǔ)設(shè)施隱憂。大模型是企業(yè)的核心數(shù)字化資產(chǎn),需要得到核心技術(shù)、數(shù)據(jù)應(yīng)用方面的多維度保障。尤其是AI大模型的技術(shù)自主化水平,在全球環(huán)境中正變得愈發(fā)重要。
3.大模型缺乏與行業(yè)結(jié)合的必要節(jié)點。行業(yè)應(yīng)用大模型,不僅需要模型的通用性與泛化性,還需要模型具備專業(yè)知識,具備行業(yè)技能。
怎么克服這些挑戰(zhàn)?答案不在辦公室、實驗室里,而在廣袤的大地上。我們必須要像少年一樣走出去,走到行業(yè)當中,走到原野當中才能看見問題,找到答案。
今天的中國,數(shù)實融合成為了產(chǎn)業(yè)經(jīng)濟的大勢所趨。中國經(jīng)濟的優(yōu)勢是行業(yè)眾多、產(chǎn)業(yè)體系全面,各行業(yè)的數(shù)字化、智能化動力蓬勃強勁,以東數(shù)西算為代表的國家級數(shù)字化基礎(chǔ)設(shè)施快速發(fā)展。
大模型必須與這些優(yōu)勢、需求結(jié)合,才能創(chuàng)造革命級的科技生產(chǎn)力,激活千行百業(yè)的深層價值。
從2021年發(fā)布以來,盤古大模型一直在思考客戶運營、產(chǎn)品研發(fā)、軟件工程、生產(chǎn)供應(yīng)、市場營銷等行業(yè)客戶真正關(guān)注的問題?!安蛔髟?、只做事”的盤古大模型,憑借一股活潑生動的少年氣,走向了行業(yè)原野。
到行業(yè)原野中去:盤古大模型3.0有何不同?
在華為云“AI for Industries”的思路下,結(jié)合時下產(chǎn)業(yè)界最關(guān)注的大模型能力趨勢,盤古大模型3.0實現(xiàn)了一系列升級,圍繞“行業(yè)重塑,技術(shù)扎根,開放同飛”三大方向,持續(xù)打造核心競爭力。
HDC.Cloud 2023當中,全面展示了盤古CV大模型、盤古預(yù)測大模型、盤古科學(xué)計算大模型、盤古NLP大模型、盤古多模態(tài)大模型五大基礎(chǔ)模型,并且發(fā)布了系列行業(yè)大模型,其中包括政務(wù)、金融、制造、軌道行業(yè)大模型。
在技術(shù)差異化層面,盤古大模型3.0包含一系列新技術(shù)特性。
其中最為外界關(guān)注的大語言模型與多模態(tài)模型領(lǐng)域,盤古3.0可以提供100億參數(shù),380億參數(shù),710億參數(shù)和1000億參數(shù)的系列化基礎(chǔ)大模型,匹配不同場景、不同時延、不同復(fù)雜度的行業(yè)需求。而這些模型可以提供一致的能力集,包括大語言模型的知識問答、文案生成、代碼生成、NL2SQL、插件調(diào)用等外界十分關(guān)注的能力,以及多模態(tài)大模型的圖像生成,圖像理解等能力。
在應(yīng)用結(jié)構(gòu)層面,盤古大模型3.0構(gòu)筑了完全面向行業(yè)提供服務(wù),以行業(yè)需求為基礎(chǔ)設(shè)計的大模型體系,包括5+N+X三層架構(gòu),即5大L0層的基礎(chǔ)大模型,能夠提供通用技能,支撐企業(yè)的各類應(yīng)用;N個L1層的行業(yè)大模型,能夠基于基礎(chǔ)大模型的多種能力組合,幫助企業(yè)通過數(shù)據(jù)微調(diào)打造符合自身需求的大模型產(chǎn)品;X是海量的L2層場景模型,場景模型更加專注于某個具體的應(yīng)用場景或特定業(yè)務(wù),為客戶提供開箱即用的模型服務(wù)。
在這三層結(jié)構(gòu)的加持下,盤古大模型3.0可以適配企業(yè)的各種需求,并通過多樣、靈活的組合排列,形成符合千行百業(yè)需求的“千面大模型”。
盤古大模型3.0,究竟為何能深入行業(yè),立足行業(yè)?這個問題,需要我們記住三個關(guān)鍵詞。
紅日初升,其道大光:大模型背后的行業(yè)沉淀
第一個關(guān)鍵詞:行業(yè)經(jīng)驗。
所謂“了解行業(yè)”,并不是某種標準化能力,而是無數(shù)技術(shù)體系、產(chǎn)業(yè)體系搭建成的經(jīng)驗集成。積累行業(yè)經(jīng)驗沒有捷徑,而是必須一個個場景深入進去,一個個案例鉆研下去,去礦山,去碼頭,去實驗室,才能用水磨功夫聚集起行業(yè)經(jīng)驗。
依托華為行業(yè)軍團,華為云沉淀了超過400行業(yè)解決方案,并和伙伴聯(lián)合打造7大行業(yè)aPaaS,從而真正沉淀各個行業(yè)的核心訴求、核心知識、核心能力。在AI方面,華為云AI已經(jīng)在各行業(yè)有超過1000個項目的合作經(jīng)驗,對各個行業(yè)的智能化訴求有具體、細致的了解。而在華為云AI for Industries的大方向下,我們可以看到盤古大模型本身即與行業(yè)知識深度結(jié)合,學(xué)習(xí)了10多個行業(yè)公開數(shù)據(jù),涵蓋金融、政務(wù)、氣象、醫(yī)療、健康、互聯(lián)網(wǎng)、教育、汽車、零售等,在每個行業(yè)板塊中學(xué)習(xí)了超過500億 tokens的數(shù)據(jù)量。
行業(yè)種類眾多、涉及合作規(guī)模龐大、行業(yè)數(shù)據(jù)量巨大的行業(yè)經(jīng)驗,最終造就了盤古大模型在行業(yè)原野上的“其道大光”。
以礦山大模型為例,讓煤礦工人在辦公室中進行遠程操作,是煤礦智能化發(fā)展發(fā)展的重心。但遠程操作會面臨礦井內(nèi)大量粉塵、水霧遮擋攝像頭,弱化監(jiān)控效果的問題。面對這個難題,盤古大模型可以將超過100路視頻拼接在同一個畫面上,通過透塵算法,異物檢測等視覺大模型技術(shù),實時識別采掘過程中的大塊巖石、大塊煤、煤倉卡堵等異常情況,從而實現(xiàn)地面工作人員不下井,就能在看清看準的情況下實時操控采煤機作業(yè)。
目前,基于盤古礦山大模型,華為云與山東能源集團深度合作,開發(fā)了21個場景化應(yīng)用,覆蓋能源行業(yè)7大業(yè)務(wù)系統(tǒng)盤古大模型的成功應(yīng)用,讓煤礦工人工作環(huán)境更加舒適安全,極大提升了礦山行業(yè)的生產(chǎn)效率與安全水準。
行業(yè)沉淀不是朝夕之功,而是經(jīng)年累月的融合與突破。盤古大模型能夠真正融入行業(yè),是因為它一早就為行業(yè)而生,而且在這條路上躬耕良久。
乳虎嘯谷,百獸震惶:自主創(chuàng)新的AI時代
第二個關(guān)鍵詞:自主創(chuàng)新。
在當前局面下,科技自立自強已經(jīng)成為國家戰(zhàn)略,行業(yè)所需,尤其在涉及國計民生的重點行業(yè),在面對大模型機遇時候?qū)ζ渥灾鲃?chuàng)新水平提出了新的需求,也只有走向全棧自主創(chuàng)新,才能夠滿足這些行業(yè)的智能化需求,真正讓AI進入行業(yè)原野。
為此,華為云盤古大模型在算力、芯片使能、AI框架、AI平臺實現(xiàn)全棧自主創(chuàng)新。華為在最底層構(gòu)建了以鯤鵬和昇騰為基礎(chǔ)的AI算力云平臺,以及異構(gòu)計算架構(gòu)CANN、全場景AI框架昇思MindSpore、AI開發(fā)生產(chǎn)線ModelArts等,為大模型開發(fā)和運行提供分布式并行加速,算子和編譯優(yōu)化、集群級通信優(yōu)化等關(guān)鍵能力?;谌A為的AI根技術(shù),大模型訓(xùn)練效能可以調(diào)優(yōu)到業(yè)界主流GPU的1.1倍。
(華為常務(wù)董事、華為云CEO張平安)
同時,華為云還積極推動大模型事業(yè)與東數(shù)西算戰(zhàn)略進行結(jié)合,會上,華為常務(wù)董事、華為云CEO張平安宣布單集群2000P Flops算力的昇騰AI云服務(wù)在華為云的烏蘭察布和貴安AI算力中心同時上線。昇騰云服務(wù)可以提供更長穩(wěn)的AI算力服務(wù),千卡訓(xùn)練30天,長穩(wěn)率達到90%,斷點恢復(fù)時長不超過10分鐘。
隨著AI技術(shù)的發(fā)展,社會經(jīng)濟的智能化躍升盡在眼前,而自主創(chuàng)新是這個時代不可規(guī)避的核心使命,打造世界AI另一極,成為了華為云的責任,也成為了中國科技的機遇。
前途似海,來日方長:以可用性為路標的AI云服務(wù)
第三個關(guān)鍵詞:真實可用。
大模型的行業(yè)落地,需要面對一系列復(fù)雜的環(huán)境挑戰(zhàn)、人才挑戰(zhàn)、商業(yè)挑戰(zhàn)??朔@些難題,不僅需要技術(shù)能力的提升,更需要在各個環(huán)節(jié)提升大模型的易用性,降低產(chǎn)業(yè)智能化門檻。對此,我們不能閉門造車,想當然地發(fā)展AI、發(fā)展大模型,而是需要走到真實的產(chǎn)業(yè)需求、開發(fā)者需求當中去。
為此,華為云以可用性為路標,構(gòu)筑了一系列真實可用的AI云服務(wù)。比如我們上面討論的大模型商業(yè)模式,就通過L0、L1到L2的三層模式,全面打通了大模型的商業(yè)模式問題,解決了企業(yè)用戶在大模型專屬性、訂制化方面的難題。
除此之外,華為云應(yīng)對企業(yè)不同的部署需求,提供了包括公有云、公有云大模型專區(qū)、混合云等多種部署模式,從而滿足不同類型企業(yè)對大模型的部署需求。
在大模型的開發(fā)友好度方面,華為云提供了易用可靠的大模型工具套件、匯聚海量多行業(yè)場景API的開天aPaaS,以及包含豐富優(yōu)質(zhì)課程和技術(shù)認證的大模型專屬社區(qū),希望與開發(fā)者及伙伴一起,共同探索盤古大模型與行業(yè)結(jié)合的創(chuàng)新路徑。
《少年中國說》中提到,“少年智則國智,少年富則國富,少年強則國強,少年獨立則國獨立”。AI大模型技術(shù)處在國際戰(zhàn)略與產(chǎn)業(yè)革命的關(guān)鍵賽點上,對于社會經(jīng)濟的數(shù)實融合、智能化升級來說,大模型扮演著“AI強則科技強,AI獨立則科技獨立”的角色。
這時候,我們需要勇于承擔責任,敢于探索未知的大模型體系。AI需要到行業(yè)知識中去,到自主創(chuàng)新中去,到開發(fā)者身邊,到企業(yè)內(nèi)部,到一間間工廠中去,到一座座礦山中去。走向原野,銳意拼搏,成為少年AI。
盤古大模型的目標,是要幫助每家企業(yè)、每個人都擁有自己的專家助手。最終,每家企業(yè),每個行業(yè)的AI之力涓滴成海,才能匯聚成年少有為的智能中國。
縱有千古,橫有八荒。前途似海,來日方長。
只有闖出去,做實事,才能讓AI技術(shù)與天不老,與國無疆。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。