極客網(wǎng)·人工智能2月19日 當時間周一,埃隆·馬斯克旗下的xAI公司正式發(fā)布了最新大模型Grok-3。這次,馬斯克不僅帶來了性能更強的AI,還秀了一把“肌肉”——20萬塊GPU組成的超級計算集群。這背后,到底是真正的技術(shù)突破,還是一場“大力出奇跡”的豪賭呢?
Grok-3確實很強,但很難算突破
從性能上看,Grok-3確實很能打。在標準AI基準測試中,它在數(shù)學(xué)(AIME)、科學(xué)(GPOA)和編程(LCB)測試中穩(wěn)居榜首,盲測表現(xiàn)也相當出色。此前代號為“Chocolate”的測試版曾在LLM Arena平臺上獲得最高ELO評分,這意味著用戶更喜歡Grok-3的回答,而不是其他模型的輸出。
更厲害的是,Grok-3的“推理測試版”在AIME 2025基準測試中拿到了93分,其他頂尖模型的得分都在87分以下。這說明,Grok-3在數(shù)學(xué)推理上確實有獨到之處。
盡管Grok-3的性能很強,但現(xiàn)場演示時,它更像是在“追趕”而不是“超越”。xAI展示了Grok-3解決物理問題和從頭編寫游戲代碼的能力,但這些功能,ChatGPT、Claude和谷歌的Gemini早就實現(xiàn)了。
換句話說,Grok-3更像是在用更強的算力,把別人已經(jīng)做過的事情做得更好,而不是開辟了一條全新的道路。
20萬塊GPU集群,比模型還出圈
不過,相比Grok-3模型的表現(xiàn),業(yè)界對馬斯克搭建的20萬塊GPU集群更感興趣——尤其是在DeepSeek掀起低成本模型訓(xùn)練的浪潮之下。
想象一下,20萬塊GPU堆在一起,這得是個多么龐大的“鋼鐵巨獸”!xAI的這個超級計算集群被命名為“巨像”(Colossus),名字霸氣,實力也不容小覷。
這個系統(tǒng)分兩個階段訓(xùn)練:先在10萬塊GPU上訓(xùn)練了122天,然后又花了92天擴展到20萬塊。xAI團隊直言,搭建這個集群比開發(fā)模型本身還難,可以說是“硬件先行,軟件跟上”的典型范例。
先跟隨再創(chuàng)新,馬斯克還有“大招”
不過,xAI的野心顯然不止于此。他們計劃在未來幾周內(nèi)推出語音交互功能,馬斯克強調(diào)這不是普通的TTS,而是真正的AI語音模型。
此外,開發(fā)者還將獲得API訪問權(quán)限和音頻轉(zhuǎn)錄功能,這意味著Grok-3將成為第三方應(yīng)用的強大工具。
更有趣的是,xAI還計劃成立一個AI游戲工作室,讓開發(fā)者利用Grok-3構(gòu)建游戲。這或許會成為Grok-3的一個新亮點,畢竟,用AI開發(fā)游戲,這事兒本身就挺酷的。
小結(jié):
20萬塊GPU的投入,讓Grok-3在性能上確實有了質(zhì)的飛躍。但技術(shù)突破的本質(zhì),不僅僅是“堆料”,更在于創(chuàng)新。Grok-3目前的表現(xiàn)更像是“大力出奇跡”的結(jié)果,但未來能否真正開辟新天地,還得看它在預(yù)告的語音、游戲和API等新領(lǐng)域的表現(xiàn)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )