豪擲20萬塊GPU訓(xùn)練Grok-3，馬斯克“大力出奇跡”了嗎？

精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<abbr id="ixlwe"></abbr>

人閱讀
2025-02-19 09:54:52
來源：極客網(wǎng)
作者：小菲
相關(guān)關(guān)鍵詞

極客網(wǎng)·人工智能2月19日 當時間周一，埃隆·馬斯克旗下的xAI公司正式發(fā)布了最新大模型Grok-3。這次，馬斯克不僅帶來了性能更強的AI，還秀了一把“肌肉”——20萬塊GPU組成的超級計算集群。這背后，到底是真正的技術(shù)突破，還是一場“大力出奇跡”的豪賭呢？

微信截圖_20250219101015.jpg

Grok-3確實很強，但很難算突破

從性能上看，Grok-3確實很能打。在標準AI基準測試中，它在數(shù)學(xué)（AIME）、科學(xué)（GPOA）和編程（LCB）測試中穩(wěn)居榜首，盲測表現(xiàn)也相當出色。此前代號為“Chocolate”的測試版曾在LLM Arena平臺上獲得最高ELO評分，這意味著用戶更喜歡Grok-3的回答，而不是其他模型的輸出。

更厲害的是，Grok-3的“推理測試版”在AIME 2025基準測試中拿到了93分，其他頂尖模型的得分都在87分以下。這說明，Grok-3在數(shù)學(xué)推理上確實有獨到之處。

下載 (1).jpg

盡管Grok-3的性能很強，但現(xiàn)場演示時，它更像是在“追趕”而不是“超越”。xAI展示了Grok-3解決物理問題和從頭編寫游戲代碼的能力，但這些功能，ChatGPT、Claude和谷歌的Gemini早就實現(xiàn)了。

換句話說，Grok-3更像是在用更強的算力，把別人已經(jīng)做過的事情做得更好，而不是開辟了一條全新的道路。

20萬塊GPU集群，比模型還出圈

不過，相比Grok-3模型的表現(xiàn)，業(yè)界對馬斯克搭建的20萬塊GPU集群更感興趣——尤其是在DeepSeek掀起低成本模型訓(xùn)練的浪潮之下。

想象一下，20萬塊GPU堆在一起，這得是個多么龐大的“鋼鐵巨獸”！xAI的這個超級計算集群被命名為“巨像”（Colossus），名字霸氣，實力也不容小覷。

這個系統(tǒng)分兩個階段訓(xùn)練：先在10萬塊GPU上訓(xùn)練了122天，然后又花了92天擴展到20萬塊。xAI團隊直言，搭建這個集群比開發(fā)模型本身還難，可以說是“硬件先行，軟件跟上”的典型范例。

先跟隨再創(chuàng)新，馬斯克還有“大招”

不過，xAI的野心顯然不止于此。他們計劃在未來幾周內(nèi)推出語音交互功能，馬斯克強調(diào)這不是普通的TTS，而是真正的AI語音模型。

此外，開發(fā)者還將獲得API訪問權(quán)限和音頻轉(zhuǎn)錄功能，這意味著Grok-3將成為第三方應(yīng)用的強大工具。

更有趣的是，xAI還計劃成立一個AI游戲工作室，讓開發(fā)者利用Grok-3構(gòu)建游戲。這或許會成為Grok-3的一個新亮點，畢竟，用AI開發(fā)游戲，這事兒本身就挺酷的。

小結(jié)：

20萬塊GPU的投入，讓Grok-3在性能上確實有了質(zhì)的飛躍。但技術(shù)突破的本質(zhì)，不僅僅是“堆料”，更在于創(chuàng)新。Grok-3目前的表現(xiàn)更像是“大力出奇跡”的結(jié)果，但未來能否真正開辟新天地，還得看它在預(yù)告的語音、游戲和API等新領(lǐng)域的表現(xiàn)。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）