馬斯克用20萬塊英偉達晶片練出Grok 3,印證了DeepSeek真的强

文|王新喜

馬斯克的人工智慧初創公司xAI發佈了更新版Grok 3大模型,馬斯克稱之為“ 地球上最聰明的人工智慧”。

馬斯克用20萬塊英偉達晶片練出Grok 3,印證了DeepSeek真的强插图1

Grok 3是用20萬塊英偉達晶片練出來的,運算能力是上代10倍。

xAI在當天的直播中,馬斯克與該公司的三比特工程師一起進行了現場演示,Grok 3在數學、科學和程式設計基準測試中,Grok 3擊敗了穀歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o。

馬斯克用20萬塊英偉達晶片練出Grok 3,印證了DeepSeek真的强插图3

據馬斯克此前介紹,Grok 3是在大量的合成數據上訓練的。 它會反復檢查數據,試圖達到邏輯一致性。 如果有錯誤的數據,它會反思並删除錯誤數據。

從現時測試看,Grok3在AIME’24數學能力測試、GPQA科學知識評估、LCB Oct – Feb程式設計能力測試等多項測試中成績均高於DeepSeek。 擁有“ 思維鏈” 推理機制,能像人類一樣逐步折開複雜任務。 參數量達1萬億級別。

馬斯克用20萬塊英偉達晶片練出Grok 3,印證了DeepSeek真的强插图5

Grok3確實在不少任務上表現得很棒,例如在處理複雜邏輯和推理任務時,它的能力確實有東西。 不過Grok3用海量GPU刷了榜單上的分數,數學、程式設計分高,其實也沒好多少,沒有拉開差距。 而DeepSeek的優勢在於中文理解和多模態互動方面,它的表現一直很穩定,在實際應用場景中已經得到了不少驗證。

最關鍵的問題在於,Grok3成本極其高,計算量是前代Grok 2的10倍,有說法是其訓練成本就30億美元,根據相關工程師透露xAI旗下超算中心算力已經翻倍。

馬斯克用20萬塊英偉達晶片練出Grok 3,印證了DeepSeek真的强插图7

去年4月,馬斯克認為xAI若想成功打造出最佳AI,唯一途徑是自建資料中心。 由於想儘快推出Grok 3,時間緊迫,於是决定在四個月內建成資料中心。 最終,團隊耗時122天讓第一批10萬個GPU啟動並運行,不過要構建理想中的AI需將集羣規模翻倍。 發佈會上透露,團隊僅用92天就已經實現了超算集羣的算力翻倍,也就是GPU數量已達20萬塊。

馬斯克用20萬塊英偉達晶片練出Grok 3,印證了DeepSeek真的强插图9

20萬塊GPU多少錢? 以英偉達H100為例,單卡價格約為2.5萬-3萬美元。 20萬塊× 3萬美元= 60億美元(僅硬體採購成本)。 這還只是GPU硬體成本,實際部署成本更高,還需考慮配套服務器、網路設備、電力、冷卻設施等,總成本可能達百億美元量級,砍一半也高達50億美金。

Deepseek從訓練成本來看僅有600萬美元,遠低於GPT-4的7800萬美元。 後續deepseek資金、人才、資源上去了,綜合能力肯定不比Grok3差。

Grok 3, 印證了DeepSeek真的强

這說明了什麼,說明了兩點,其一,馬斯克花了那麼多錢堆了比OpenAI還多的算力,最後搞出來個跟OpenAI差不多的產品。 第二,
這證明了DeepSeek真的强啊,馬斯克大把燒美金當柴火搞煉丹,效果全靠堆硬體,而且從數據來看,和DeepSeek並沒有拉開多少差距
, DeepSeek那邊走低成本路線都能差不多打平手,那只能更說明DeepSeek非常强。

因為這是兩條不同的路線,一個是力大拍磚大力出奇迹堅定地砸錢堆算力,一個是創新的工程設計與高效的訓練方法,優化節省資源追求極致性價比,是兩條完全不同的路線。


堆算力的遊戲,是讓AI成為美國人主導算力資源分配的遊戲。
美國可以通過控制GPU晶片出口,精確調控全球AI生產力水准。 並且把全球獲取AI算力劃分為三個等級圈,由它來控制分配,這讓其他國家陷入絕望。

而且特朗普還投資5000億美元的“ 星際之門”, 目的就是將AI領先牢牢鎖在美國本土,吸引把日韓、中東、歐洲等相關資金,把除中國外的其他實力國家牢牢綁在老美的AI戰車之上。

而DeepSeek則打破了這種主導,給了其他所有國家看到了自主發展AI的希望,因為它在實現OpenAI模型的同等效能時,僅需要對方5%的算力,以低成本模式直接掀翻了美國一眾科技巨頭,這下所有的國家都覺得自己都能行了。 因為,這意味著所有的國家都不需要依賴美國高算力GPU晶片資源了,而且還能把成本極大的降下來。

馬斯克用20萬塊英偉達晶片練出Grok 3,印證了DeepSeek真的强插图11

這是現在到處搞錢的特朗普特別看重的能力,DeepSeek的橫空出世,為啥不光是英偉達、AMD等企業很快接入,特朗普也一反常態的點贊—& mdash; 他們就一個意思:省成本,省社會總成本,可以給整個國家省下老鼻子錢了。

而且在AI大模型發展到現在,其實模型能力已經很難分出絕對的勝負了,在大名額不斷趨同的背景下,開源才是大招,知名投資人朱嘯虎曾經提出一個判斷,開源模型的基礎就是閉源模型的斬殺線,今後閉源模型必須要做到開源基礎的兩到三倍才有活下去的機會。 否則十倍成本砸下去效能只提高20%,那即使是矽谷的投資人也不會接受這樣的結果。

而真用起來如何,也只有開源的才能比較充分測試。 不開源,人家還交錢用,還沒什麼特別領先的,商業模式就很難成立。

加上有Chatgpt和deepseek的巨大成功在前,grok1和grok2差不多無人問津,grok3單純砸錢堆算力實現大火上演反轉劇情的幾率並不大。

如果不開源,馬斯克巨大的投入無法變現,或會自用到自己的機器人和FSD。
不過話說回來,現時特斯拉FSD用戶訂閱並不高,但是Grok-3還是能增强FSD的競爭力。

因為Grok 3基於10萬塊英偉達H100晶片訓練,每秒可處理超過1.5萬億參數,能實时解析車載攝像頭、雷達等感測器數據,比競品在識別豪雨天氣下道路積水深度的準確率高37%,可幫助自動駕駛系統更精准地感知周邊環境。

此外是Grok 3引入“ 思維鏈” 科技,可類比人類逐步推理過程,在導航時能綜合分析實时交通數據、充電樁可用性和用戶日程推薦路線,在自動駕駛場景中,面對複雜路况和交通信號時能做出更合理、安全的決策。

如果特斯拉將其用到FSD,這意味著新能源車企的智駕競爭會更加激烈,對此中國的車企要有足够的認知與準備。

相對於Grok3,deepseek的優勢是創新的工程設計與算灋優化實現的超低成本、其次是開源模式的生態與科技優化能力會讓未來包括美國在內的很多科研人員只能在東大的AI模型上搞開發了! 東大有望成為世界AI的開發中心。 加上我們舉國之力支持,中國成百上千行業都在快速接入,促進它不斷進化,和千行百業結合實踐,產生生產力。 未來發展潜力,可能不是Grok3能比的,我們拭目以待。

原文網址:https://zh.gushiio.com/ai/2720.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *