高效靈活的云上基礎(chǔ)設(shè)施,是大模型創(chuàng)業(yè)的必要底座。
7月20日,騰訊云對外披露助力MiniMax研發(fā)大模型的最新進(jìn)展。目前,騰訊云長期支持MiniMax的千卡級任務(wù)穩(wěn)定運行在騰訊云上,可用性達(dá)99.9%。
MiniMax是一家專注通用大模型研發(fā)的獨角獸創(chuàng)業(yè)企業(yè),擁有文本、語音、視覺多種模態(tài)融合的通用大模型引擎能力。研發(fā)過程中,每日億級的調(diào)用次數(shù),也帶來了對算力的海量需求。
從2022年6月起,基于算力集群、云原生、大數(shù)據(jù)、安全等產(chǎn)品能力,騰訊云為MiniMax搭建了從資源層、數(shù)據(jù)層到業(yè)務(wù)層的云架構(gòu)。
在資源層,高性能、高彈性和高穩(wěn)定的算力需要借助專業(yè)的云服務(wù)。騰訊云協(xié)同優(yōu)化單機(jī)算力、網(wǎng)絡(luò)架構(gòu)和存儲性能,為MiniMax構(gòu)建起大規(guī)模、分布式的HCC高性能計算集群。
借助騰訊自研的星脈網(wǎng)絡(luò),HCC集群將通信損耗降到更低;CFS Turbo、COS+GooseFS高性能存儲,使得上千個計算節(jié)點能同時高速讀取訓(xùn)練數(shù)據(jù)。
同時,利用騰訊云容器服務(wù)TKE,MiniMax實現(xiàn)了對不同規(guī)格云服務(wù)器的統(tǒng)一管理和調(diào)度,各種類型的應(yīng)用和服務(wù)得以部署在同一套基礎(chǔ)設(shè)施上,資源實現(xiàn)了高效整合,資源利用率大幅提升;
基于云原生的管理方式,支撐7*24小時的全局監(jiān)控視角,支持編排、框架、實例等多層級的指標(biāo)監(jiān)控。一旦觸發(fā)故障,能夠在5分鐘內(nèi)恢復(fù)任務(wù)、10分鐘內(nèi)恢復(fù)基礎(chǔ)設(shè)施,無需人工干預(yù)完成,能夠最大化保障任務(wù)連續(xù)進(jìn)行。
根據(jù)實測數(shù)據(jù),在云底座的支撐下,騰訊云助力MiniMax扛住了激增的并發(fā)計算量;基于云原生架構(gòu),MiniMax整體用云成本降低了20%。
在數(shù)據(jù)層,MiniMax在大數(shù)據(jù)分析方面也有大量的任務(wù)需求。
通過騰訊云的數(shù)據(jù)集成DataInlong、流計算Oceanus、數(shù)據(jù)湖計算DLC等云原生大數(shù)據(jù)產(chǎn)品提供的數(shù)據(jù)處理能力,對大量數(shù)據(jù)做實時或離線分析,滿足了MiniMax在各個階段的數(shù)據(jù)分析需求,實現(xiàn)數(shù)據(jù)的快速靈活部署。以容器化的方式使用大數(shù)據(jù)組件,使得模型驗證、推理等任務(wù)得以按計劃推進(jìn)。
此外,大模型研發(fā)過程中,MiniMax對云上資產(chǎn)安全、Web業(yè)務(wù)運營風(fēng)險、DDoS攻擊防護(hù)等高度關(guān)注。
通過引入騰訊云的防火墻、WAF、主機(jī)安全、漏洞掃描、數(shù)據(jù)加密、iOA零信任安全管理等一系列安全產(chǎn)品,MiniMax實現(xiàn)了對云上資產(chǎn)的全方位保護(hù),確保業(yè)務(wù)的穩(wěn)定運行和數(shù)據(jù)的安全性。
業(yè)務(wù)上云后,基于海量、彈性的算力支撐和大量改進(jìn)調(diào)優(yōu),MiniMax的大模型研發(fā)得以加速。
MiniMax業(yè)務(wù)副總裁魏偉表示:“成熟的云基礎(chǔ)設(shè)施,既滿足了業(yè)務(wù)彈性與穩(wěn)定性的需要,又提升了研發(fā)效率。MiniMax將進(jìn)一步擴(kuò)大用云規(guī)模,與騰訊云加速訓(xùn)練、推理等更多業(yè)務(wù)場景的云上落地,共同打造面向大模型的云上基礎(chǔ)設(shè)施。相信未來,云計算會為AIGC帶來更多可能。”
在算力集群、星脈網(wǎng)絡(luò)、向量數(shù)據(jù)庫之外,騰訊云還推出了涵蓋模型預(yù)訓(xùn)練、模型精調(diào)、智能應(yīng)用開發(fā)的一站式行業(yè)大模型解決方案,助力企業(yè)快速搭建專屬模型。
未來,騰訊云將繼續(xù)通過軟硬一體的方式,持續(xù)加速全社會云上創(chuàng)新。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )