馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？

文|科技旋渦

北京时間2月18日午間，馬斯克旗下人工智慧初創公司xAI正式發佈新一代聊天機器人Grok 3。馬斯克和他的人工智慧團隊聲稱，Grok 3測試版的高級推理能力超過了現有的人工智慧模型。

馬斯克這個號稱地表最聰明的AI，完美詮釋了什麼叫&ldquo；有錢任性&rdquo；，只因其使用了20萬塊GPU訓練模型。那麼，它真的能够超越風頭正盛的DeepSeek和行業先鋒OpenAI嗎？

燒錢無數的Grok 3有多强？

在Grok 3的直播中，馬斯克等人介紹了Grok 3的訓練歷程。去年馬斯克劇透，Grok 3在10萬張H100上進行訓練，是首個達到如此訓練集羣規模的模型。今天的發佈會上又透露，到訓練進行到第92天時，集羣規模擴展到了20萬卡。

馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？插图1

Grok 3的實力也的確證明了，在當下這個時期，砸錢是一種巨大的優勢。這一波Grok 3有滿血和mini兩個版本，在數學、科學、程式碼等數据集上表現均超過了GPT-4o、DeepSeek-V3等非推理模型。

馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？插图3

Grok-3 mini的效能基本上領先或媲美其他閉源/開源模型。在著名大模型LMSYS Arena排行榜中，Grok-3刷榜，Elo評分超1400位列最高，沒有任何一個模型能與之相比，堪稱斷層式領先。

馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？插图5

xAI團隊還展示了Grok 3如何執行有趣的任務。例如計算從地球到火星的航天器任務。 Grok 3生成了一張太空發射的動畫3D軌跡圖（即從地球到火星然後再返回地球的可行軌跡）。這涉及一些複雜的物理知識，Grok 3需要理解這些內容。

馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？插图7

Grok 3還展示了在自動化遊戲開發方面的潜力。 xAI團隊要求Grok 3現場創造一款融合《俄羅斯方塊》和《寶石迷陣》的新遊戲。 Grok 3生成的Python腳本定義了遊戲的常數、顏色、方塊形狀等元素，並呈現出獨特玩法：當連接了至少三個相同顏色的方塊時，會觸發重力機制使方塊消除，這種管道類似《寶石迷陣》。

此外，Grok 3包含一個名為Big Brain的功能，這是一個推理模型模式，允許在處理査詢時進行更深入的思考。馬斯克指出，17個月前，最初的Grok模型幾乎不能解决高中問題，而現在它已經進步了很多，他幽默地比喻&ldquo； Grok已經準備好上大學了&rdquo；。

性價比與猛砸錢，大模型的路該怎麼走？

眾所周知，DeepSeek通過獨特的算灋優化、架構設計以及高效的資源利用管道，大幅降低了對英偉達高端GPU的依賴。這也致使英偉達股價暴跌16.97%，市值單日蒸發約5926.58億美元。

馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？插图9

DeepSeek聲稱其模型訓練成本僅為同類模型的1/5至1/10，這意味著其在擺脫英偉達硬體束縛的情况下，仍然在推理效能等方面都表現出與ChatGPT-o1接近的能力，部分領域還有所超越。

反觀馬斯克的Grok 3不僅砸進去20萬塊GPU，更是為了儘快推出Grok 3，在短短四個月內建成資料中心。如此巨大的投入換來的也僅僅只是lmArena排行榜中41分的提升，這真的值嗎？

馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？插图11

事實上，馬斯克瘋狂砸錢的舉動或許有著提前佈局的考量。當下，任何AI的訓練都離不開GPU，只不過DeepSeek走的是&ldquo；精算師路線&rdquo；& mdash;& mdash; 通過算灋優化，用行業1/10的成本實現90%的效能。而馬斯克的20萬塊GPU不僅是為了快速推出Grok 3，更可能是為了後續依舊保持快速反覆運算的選擇。