馬斯克花錢砸出的Grok 3,超越DeepSeek與OpenAI?
文|科技旋渦
北京时間2月18日午間,馬斯克旗下人工智慧初創公司xAI正式發佈新一代聊天機器人Grok 3。 馬斯克和他的人工智慧團隊聲稱,Grok 3測試版的高級推理能力超過了現有的人工智慧模型。
馬斯克這個號稱地表最聰明的AI,完美詮釋了什麼叫“ 有錢任性”, 只因其使用了20萬塊GPU訓練模型。 那麼,它真的能够超越風頭正盛的DeepSeek和行業先鋒OpenAI嗎?
燒錢無數的Grok 3有多强?
在Grok 3的直播中,馬斯克等人介紹了Grok 3的訓練歷程。 去年馬斯克劇透,Grok 3在10萬張H100上進行訓練,是首個達到如此訓練集羣規模的模型。 今天的發佈會上又透露,到訓練進行到第92天時,集羣規模擴展到了20萬卡。
Grok 3的實力也的確證明了,在當下這個時期,砸錢是一種巨大的優勢。 這一波Grok 3有滿血和mini兩個版本,在數學、科學、程式碼等數据集上表現均超過了GPT-4o、DeepSeek-V3等非推理模型。
Grok-3 mini的效能基本上領先或媲美其他閉源/開源模型。 在著名大模型LMSYS Arena排行榜中,Grok-3刷榜,Elo評分超1400位列最高,沒有任何一個模型能與之相比,堪稱斷層式領先。
xAI團隊還展示了Grok 3如何執行有趣的任務。 例如計算從地球到火星的航天器任務。 Grok 3生成了一張太空發射的動畫3D軌跡圖(即從地球到火星然後再返回地球的可行軌跡)。 這涉及一些複雜的物理知識,Grok 3需要理解這些內容。
Grok 3還展示了在自動化遊戲開發方面的潜力。 xAI團隊要求Grok 3現場創造一款融合《俄羅斯方塊》和《寶石迷陣》的新遊戲。 Grok 3生成的Python腳本定義了遊戲的常數、顏色、方塊形狀等元素,並呈現出獨特玩法:當連接了至少三個相同顏色的方塊時,會觸發重力機制使方塊消除,這種管道類似《寶石迷陣》。
此外,Grok 3包含一個名為Big Brain的功能,這是一個推理模型模式,允許在處理査詢時進行更深入的思考。 馬斯克指出,17個月前,最初的Grok模型幾乎不能解决高中問題,而現在它已經進步了很多,他幽默地比喻“ Grok已經準備好上大學了”。
性價比與猛砸錢,大模型的路該怎麼走?
眾所周知,DeepSeek通過獨特的算灋優化、架構設計以及高效的資源利用管道,大幅降低了對英偉達高端GPU的依賴。 這也致使英偉達股價暴跌16.97%,市值單日蒸發約5926.58億美元。
DeepSeek聲稱其模型訓練成本僅為同類模型的1/5至1/10,這意味著其在擺脫英偉達硬體束縛的情况下,仍然在推理效能等方面都表現出與ChatGPT-o1接近的能力,部分領域還有所超越。
反觀馬斯克的Grok 3不僅砸進去20萬塊GPU,更是為了儘快推出Grok 3,在短短四個月內建成資料中心。 如此巨大的投入換來的也僅僅只是lmArena排行榜中41分的提升,這真的值嗎?
事實上,馬斯克瘋狂砸錢的舉動或許有著提前佈局的考量。 當下,任何AI的訓練都離不開GPU,只不過DeepSeek走的是“ 精算師路線”& mdash;& mdash; 通過算灋優化,用行業1/10的成本實現90%的效能。 而馬斯克的20萬塊GPU不僅是為了快速推出Grok 3,更可能是為了後續依舊保持快速反覆運算的選擇。
寫在最後
誠然,馬斯克的Grok 3的確超越了DeepSeek,但似乎更像是一個加强版,而非大跨度的領先。 我們期待看到未來DeepSeek依舊能够憑藉超高的“ 性價比” 再度震驚世界。
原文網址:https://zh.gushiio.com/ai/1898.html