隨著我國人工智能技術不斷演進,算力基礎設施已成為中國數(shù)字經(jīng)濟的“新基建”。智算中心,作為新型算力基礎設施,已成為中國現(xiàn)今社會經(jīng)濟發(fā)展階段和企業(yè)數(shù)字化轉型的關鍵,同時將推動人工智能在大語言模型、自動駕駛、生物醫(yī)藥、工業(yè)制造和城市管理等行業(yè)的深度落地。
近日,優(yōu)刻得推出了資源豐富、高效可靠的智能算力平臺——“孔明”智算平臺(以下稱為“孔明”),能夠面向各行業(yè)領域用戶,提供更加卓越的智能算力和資源智慧管理服務。
值得一提的是,優(yōu)刻得是最早一批響應國家“東數(shù)西算”戰(zhàn)略的企業(yè),已建成青浦和烏蘭察布兩大智算中心,目前管理的算力規(guī)模超過3000P,兩個數(shù)據(jù)中心穩(wěn)步擴建發(fā)展,為后續(xù)的算力部署提供了強有力的支撐。
功能及優(yōu)勢
基于優(yōu)刻得的算力資源支持,“孔明”智算平臺具備三大產(chǎn)品優(yōu)勢。使其能夠勝任在AI領域內的大部分業(yè)務,幫助大模型公司提高訓練效率、優(yōu)化模型性能、降低開發(fā)成本,進一步推動AI大模型在各行業(yè)領域的發(fā)展和應用。
一、支持同構和異構卡訓練的統(tǒng)一調度和管理
對于智能計算,通常需要大規(guī)模的數(shù)據(jù)集來進行AI模型的訓練,常達到千卡的訓練集群規(guī)模?;趦?yōu)刻得多年公有云運營的成熟架構體系,“孔明”智算平臺支持同構和多種異構卡型的接入,包括但不限于NVIDIA、AMD、Intel等品牌,甚至是各類國產(chǎn)GPU卡型,同時支持訓練集群的統(tǒng)一調度和管理。這樣的設計允許企業(yè)根據(jù)自身需求選擇最適合的硬件設備,從而顯著提高計算效率并獲得更好的性能。
不僅如此,“孔明”智算平臺還提供軟硬件協(xié)同交付,支持私有化和公有云等多種交付方式。這意味著,無論企業(yè)需要在哪種環(huán)境中進行計算任務,都可以無縫接入大模型業(yè)務,輕松應對復雜的計算需求。
二、支持多樣化組網(wǎng)方式接入
“孔明”智算平臺具備強大的網(wǎng)絡接入能力,支持多種組網(wǎng)方式,包括但不限于IB、RoCE、TCP/IP協(xié)議。這樣的多樣化網(wǎng)絡接入方式,使得在AI智算場景下,不同業(yè)務場景的需求能夠得到充分滿足。無論是需要低延遲和高吞吐量的數(shù)據(jù)傳輸,還是對網(wǎng)絡安全性的嚴格要求,“孔明”智算平臺都能提供相應的網(wǎng)絡支持。
三、支持分布式訓練及斷點續(xù)訓
大模型通常需要大量的計算資源和可擴展的存儲系統(tǒng)來支持其訓練和推理過程。“孔明”智算平臺全面擁抱大模型業(yè)務,為大語言模型提供分布式訓練和斷點續(xù)訓的能力。智算集群支持彈性擴展,可根據(jù)客戶當前的資源數(shù)量進行集群動態(tài)管理。這使得模型開發(fā)者能夠更充分地利用算力資源,以更高的效率來訓練和優(yōu)化模型。
同時,平臺還接入了高性能存儲UPFS,該存儲系統(tǒng)支持GPU Direct Storage,顯著提升了存儲吞吐性能,Checkpoint速度較傳統(tǒng)存儲提升了近10倍。以上功能特性,為大模型的開發(fā)和應用提供了強有力的支持,幫助客戶更高效地處理大規(guī)模數(shù)據(jù)和加速深度學習訓練。
此外,“孔明”智算平臺還提供智能運維功能,例如故障告警和節(jié)點自愈等,以確保計算環(huán)境的穩(wěn)定性和可靠性。這為模型開發(fā)者提供了一個穩(wěn)定而強大的模型開發(fā)環(huán)境,使其能夠專注于算法和模型的創(chuàng)新,而不需要過多關注基礎設施的管理和維護。
基于優(yōu)刻得云主機、裸金屬、高性能存儲、低延遲網(wǎng)絡等基礎設施,搭配“孔明”的資源調度、多用戶管理、分布式訓練的能力,以及模型推理服務平臺UModelVerse,優(yōu)刻得將服務大模型開發(fā)者、提供商、應用廠商、高校及科研機構等合作伙伴,提供一站式的AI計算開發(fā)服務,為大模型產(chǎn)業(yè)發(fā)展賦能。
適用領域及應用
“孔明”智算平臺在大模型分布式訓練、自動駕駛、生物醫(yī)藥、工業(yè)制造、城市治理等領域具有廣泛的應用,并且為這些領域的AI模型訓練和應用提供了顯著的效率提升和便捷性。
一、大模型分布式訓練
“孔明”智算平臺積極響應大模型客戶需求,提供分布式計算和斷點續(xù)訓的能力。通過智算平臺,用戶可以輕松調配和管理大規(guī)模的訓練任務,快速迭代和優(yōu)化模型。
二、自動駕駛領域
基于“孔明”智算平臺和優(yōu)刻得自建的烏蘭察布和青浦數(shù)據(jù)中心,可為客戶提供高達千卡并行的訓練集群,高效穩(wěn)定且性價比高,顯著提高自動駕駛模型訓練速度,大幅縮短模型迭代周期。
三、生物醫(yī)藥領域
“孔明”智算平臺針對AI制藥行業(yè)的需求,通過提升集群性能和訓練效率,為諸如分子動力學仿真模擬訓練等任務的執(zhí)行提供了強力支持。借助“孔明”智算平臺,生物醫(yī)藥領域的研究人員和開發(fā)者能夠更快速地進行復雜的分子模擬和仿真訓練,從而加速藥物研發(fā)和優(yōu)化過程。
四、工業(yè)制造領域
利用“孔明”智算平臺的高性能計算能力,可以顯著提高工業(yè)仿真、工業(yè)復核等任務的效率。通過高性能計算和快速數(shù)據(jù)處理,加速復核過程,減少錯誤和瑕疵,并提高整體生產(chǎn)效率。工業(yè)制造企業(yè)能夠更高效地進行工藝優(yōu)化、資源規(guī)劃和生產(chǎn)調度,從而實現(xiàn)更加智能化和高效的工業(yè)制造,為產(chǎn)業(yè)升級和發(fā)展提供有力支撐。
五、城市治理領域
借助“孔明”智算平臺強大的計算能力和數(shù)據(jù)處理能力,城市管理者可以實時監(jiān)測和分析城市的各項指標,如交通流量、環(huán)境污染、垃圾管理等?;谶@些數(shù)據(jù),他們能夠制定更有效的城市規(guī)劃和資源分配策略,提升居民生活質量、促進城市智慧、可持續(xù)發(fā)展。
寫在最后
在不久的將來,“孔明”智算平臺希望發(fā)展成為一個智能計算的核心樞紐,而且成為推動產(chǎn)業(yè)數(shù)字化發(fā)展的重要引擎。優(yōu)刻得將持續(xù)踐行創(chuàng)新精神,積極響應市場需求,以穩(wěn)定可靠的平臺和全鏈路的服務支持,助力企業(yè)實現(xiàn)數(shù)字化轉型和智能化升級。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )