Gork-3語音功能上線! 馬斯克手把手教學搭建10萬GPU超算中心
文章來源:矽兔君
Image source: Generated by AI
今天,由xAI開發的Grok APP推出了實时語音模式,共支持10種模式,用戶可通過語音與AI對話甚至電話式溝通,進一步提升Grok系列大模型資訊互動體驗。
就在前不久,2月20日上午,Grok 3宣佈向x用戶免費開放。 xAI發帖稱,世界上最聰明的AI Grok3現在免費提供(直到我們的服務器崩潰)。
此前,馬斯克帶著xAI首席工程師Igro、研究工程師Paul、推理工程師Tony在社交媒體X上直播發佈最新AI大模型Grok-3,引發700萬人次觀看。
發佈當天,xAI稱在數學、科學和編碼基準測試中,Grok-3擊敗了OpenAI的GPT-4o、穀歌的Gemini、DeepSeek的V3模型和Anthropic的Claude。
馬斯克稱Grok-3在很短的時間內比Grok 2效能提高了一個數量級,為
“地球上最智慧的AI”
。
此次,xAI還通過Grok-3推出了一款新的智慧搜尋引擎DeepSearch,可以直觀展現自己理解題目,表達其理解査詢的過程以及計畫響應的管道。 馬斯克特別強調到現時該模型只是測試版本,後續將不斷改進模型。 “幾乎每24小時,你就能看到改進版本。”
據悉,馬斯克的xAI正洽談一輪融資,籌資約100億美元,估值約為750億美元。 據PitchBook數據,現時該公司的最新估值約為510億美元。 同時,馬斯克旗下社交媒體X正洽談以440億美元的估值籌集資金。
現在,X Premium+和SuperGrok用戶將享有更高的存取權限,並可搶先體驗語音模式等高級功能。
Grok3體驗地址: https://x.com/i/grok
馬斯克如何在122天內打造最大資料中心集羣?
馬斯克在40分鐘的直播中花費了十幾分鐘詳細介紹了自己是如何搭建起建資料中心集羣。
馬斯克提到訓練Gork-2時,大約花費了6500張H100處理器,
他們為Gork-3準備了10萬GPU
。儘管馬斯克能够在極短的時間內籌備出10萬張GPU,但是,xAI團隊仍需要解决能源、場地等一系列問題。
“在122天內,我們能够讓10萬個GPU處理器運轉起來。我相信,這是同類中最大已經投產的H100集羣。”Igro補充道。 在隨後92天時間裏,xAI又投入了10萬個GPU,並加速推出了Gork-3。
首先是他們急需尋找一個工廠。
因為新建工廠時間肯定來不及,所以他們優先選擇一些已有的,且廢棄的工廠。 最後,他們選擇了馬斯克資料中心集羣主要位於美國田納西州孟菲斯市。
圍繞著工廠,他們接下來需要
解决資料中心的能源問題
。為了趕進度,xAI馬不停蹄地推動資料中心運轉,甚至一開始租借了非常多的發電機,以及一些發電車來保證資料中心的運轉,直到整個工廠的電力系統搭建完善,接入公共電力體系。
在試運行電力階段,xAI發現超算中心的電力時十分不穩定的,GPU集羣所承載的電力會非常波動,會經常造成發電機故障。 為了解决這一難題,xAI特別借用了特斯拉的團隊,最後選擇採用了Megapacks管道來平滑整個電力使用,形成較為穩定的
電力運載系統
。
現在資料中心的電力並不維持在某一兩個開關上,xAI團隊對整個資料中心集羣重新設計。 “具體而言,我們現在資料中心廠房構建管道相對特殊,走進我們廠房裏,你拉掉幾個電纜線,資料中心仍然能够正常運行。這可能是大多數資料中心團隊並不會關注的。”Paul說道。
解决了電力,就要開始
管理網絡
的事情。 在資料中心搭建階段,馬斯克提到團隊曾在淩晨四點去解决網絡連接設備不匹配等問題。
資料中心運作的時,為了解决冷卻問題,馬斯克談到自己幾乎租用了1/4的美國移動冷卻設備,來保持廠房內溫度正常,並設立重新搭建了
完善的液冷系統
。
馬斯克在122天內迅速搭建成了一個集成10萬GPU的超算中心。 同時,在92天時間內又將該資料中心擴大了一倍。 從馬斯克的講述中,我們可以看到打造一個真正的資料中心,並不容易,但其强大的資源整合能力,實現這一目標。
馬斯克旗下的xAI在落後微軟、Meta、OpenAI幾個月時間內,仍然能够推出Gork系列模型,並且迅速訓練出Gork-3趕上AI大模型第一梯隊。 可以看出,快速的響應能力、强大的資源支持,優秀的人才團隊都是xAI在AI大模型競爭中的優勢所在。
親自體驗Grok-3! 9.11還是比9.9大?
據直播透露,Grok-3在所有效能、所有分類上均比Grok-2高上10倍。
儘管現時模型還在測試階段,但在數學、科學和編碼基準測試中,Grok-3得分高於OpenAI的GPT-4o、穀歌的Gemini、DeepSeek的V3模型和Anthropic的Claude。 OpenAI聯合創始人、AI大牛Andrej Karpathy曾在X上發佈了對模型的初步感受,並寫道“感覺它堪比OpenAI最强大模型的領先水準”。
直播中,首席工程師Igro回應了此前的網友猜測,chocolate模型正是Grok-3的原型,在盲測過程中獲得了1400分,受到不少用戶的喜愛。
為了體驗Grok-3的推理能力,xAI讓Grok-3做一份火星移民計畫,問其人類如何能從火星到地球,並從地球回火星,並形成3D動畫圖。 Grok-3收到指令後馬上開始了思考,作為最新具有推理能力的模型,Grok-3同樣能够將思考的過程展現給用戶。
但這並非完全展示,
馬斯克提到為了避免覈心邏輯被“抄襲”,他們也將思考的過程做了一部分遮罩。
同時,xAI還給了Grok-3另一個新的指令,也是xAI內部成員最喜歡xAI做的事情之一——創造一個頗具創新的遊戲,要求集合連連看和俄羅斯方塊兩種玩法。 大約十幾分鐘後,我們也看到了相關的遊戲生成,並且成功運轉。
在我們實際測試中發現,Grok-3的數學水准忽上忽下。 比如說,在我們2月20日體驗的時候,Grok-3仍然分不清9.9和9.11誰大誰小。
但是,如果你在Grok-3中選擇DeepSearch的話,Grok-3則會從數十個頁面中選擇各種資訊綜合分析,最終給出更為全面的答案。
Grok-3最為出名的則是其數學、科學等領域的思考能力。 我們選擇了一道全球奧林匹克競賽題提問Grok-3。 很遺憾的是,無論是Grok-3,還是DeepSearch版本,答案均錯誤。
Gork大模型將衝擊圖靈獎? xAI首次發佈AI agent
正當首席工程師Igro想要介紹Grok-3時,馬斯克頗有閒心談起來Grok的取名由來。
Gork原來是一本小說《Strange Land》裏的一個火星人的名字,Gork本身也代表著深刻理解某件事。
看起來,老馬在哪裡都不忘他的火星夢。
研究工程師Paul提到,距離Gork-1發佈時間剛剛過去17個月,但Gork系列模型的效能卻已經追上全球第一梯隊大模型的水准,與OpenAI的4o模型不相上下。
“我們17個月前發佈Gork-0基本什麼都不懂,17個月後我們終於有一個孩子終於從高中畢業了。現在我們的孩子終於要準備上大學了。”Tony說道。 馬斯克說到未來AI能够獲得一些大獎,如圖靈獎或者諾貝爾獎等。 這或許也能較為真實反映出Grok-3現時的數學水准,和高考生相似。
xAI認為,僅僅有最强的預訓練模型,也不足以建立最佳AGI。 “最佳的AGI需要像人類一樣能够思考,能够自我批判,驗證所有的解決方案,且還要從第一性原則中思考。”Igro說到。
為了達到目的,xAI將預訓練模型和强化模型放在一起訓練,激發模型本身的强化推理能力。 同時,在xAI內部還有一個被稱為“Big brain”的模式,能够激發Grok-3擁有更多思考能力。
Grok-3目前有Resoning Beta和mini兩種型號,其中小模型mini模式下,能够更快反應,同時其回答質量也能和Resoning Beta在同一水準內。
Gork-3是xAI在推理模型上走出的第一步,儘管該模型仍處在完善階段,但xAI仍憑藉Gork-3趕上了推理模型第一梯隊。 同時,在直播中xAI將Agent列為自家大模型系列的下一步,並推出了Deep Search產品。
該產品主要幫助工程師、科學家、程式師們進行程式碼編輯。 “有點像是下一代搜尋引擎,你可以向其發出提問。”Paul介紹道。
此次直播最後回到用戶提問環節,xAI談及了開源問題。 一般來說,xAI會在正式推出下一代大模型時候,會選擇開源上一代模型。
xAI在直播時也回應到,當Gork-3正式推出後,同樣會開源Gork-2。
原文網址:https://zh.gushiio.com/ai/2859.html