deepseek勸不了谷歌們

文|字母榜，作者|彥飛，編輯|王靖

過去一個月，deepseek以大約十分之一的訓練成本，推出與openai o1性能接近的開源模型r1，“小力出奇蹟”的新範式震撼全球ai大模型行業。同時，外界對於大型科技公司動輒數百億美金的ai研發開支，也產生了越來越多的質疑。

但被“deepseek衝擊”嚇了一跳的科技巨頭，並沒有因此改弦更張。相反，他們正揮舞著支票簿，試圖靠瘋狂砸錢，重新奪取ai大模型的制高點。

2月5日，谷歌母公司alphabet發布2024年第四季度財報，營收和淨利潤均實現兩位數百分比的同比增長。引人注目的是，alphabet宣布，2025財年的資本支出將達到750億美金（約合人民幣5454億元），以繼續擴展其人工智慧戰略。

一年投入750個“小目標”研發ai，遠遠超出了華爾街599.4億美金的預期。不過，谷歌有實力如此燒錢：截至去年底，它持有現金、現金等價物及有價證券約957億美金。

稍早時候，谷歌還向ai明星創業公司anthropic追加投資10億美金。2023年至今，谷歌向這家公司累計投資35.5億美金。

財大氣粗的谷歌投身ai燒錢競賽，其他科技巨頭也不遑多讓。

今年1月初，微軟宣布將於2025財年投資800億美金，建設ai數據中心。這筆投資創下了微軟成立以來的單筆投資最高記錄。而在上一財年，微軟的資本支出超500億美金，大部分用於ai相關的基礎設施。

社交網絡巨頭meta在1月底宣布，公司將在今年投資600億~650億美金，並大幅擴張ai團隊，以期實現meta ai服務10億人、llama 4成為行業領先大模型的目標。meta創始人扎克伯格稱，今年將是“ai決定性的一年”。

openai則拉上軟銀、甲骨文、微軟、arm、英偉達預計投資5000億美金。中東人工智慧基金（mgx）等產業和投資巨頭，聯手成立“星際之門”，這些資金將被用於數據中心等ai基礎設施的建設與運營。

相比之下，國內科技巨頭面向ai大模型的砸錢規模小了一個數量級，但也動輒數百億元，且增長很快。

根據財報等公開信息，2024年前三季度，百度、阿里、騰訊的總資本開支約為人民幣867億元。金融數據服務商visible alpha預計，到2027年，bat的資本支出將達到1767億元，年複合增長率超26%。考慮到bat的重視程度，這些資本開支將有很大一部分流向ai大模型。

不難看出，科技巨頭發展ai大模型，砸錢仍然是基本武器之一。儘管deepseek證明了“小力出奇蹟”的可行性，但巨頭們出於多種原因，仍然沿著“大力出奇蹟”的路線前行。

這並非僅僅是大公司的慣性使然。openai剛剛發布的o3-mini，已經在物理推理等多項指標上反超r1，而更強大的o3標準版也已經箭在弦上。這也再次證明，“尺度定律”仍然是ai大模型的基本規則之一，而“小力出奇蹟”並非置之四海而皆準。

尚未找到“金主爸爸”的deepseek，在算力、數據、資金和資源方面比不上巨頭，正面臨被後來者強行超車的危險。不過，r1的成功，也證明了“小力出奇蹟”的可行。在deepseek震動全球ai圈後，巨頭青睞的“砸錢”與“小力出奇蹟”的路線之爭仍在繼續，遠未分出勝負。

01

面對快速崛起的deepseek，美國科技巨頭表面上對其技術、產品和方法論讚嘆不已，但在戰略層面上，並沒有對其“小力出奇蹟”的策略亦步亦趨。

恰恰相反，在deepseek席捲全球ai大模型領域後，巨頭們的砸錢邁向了新高度。

以openai為例，奧特曼起初對於deepseek有所懷疑，稱“並不新穎，我們早已具備這一水平的模型”，且“被嚴重誇大了”。openai甚至在1月底表示，deepseek涉嫌使用openai專有模型訓練自己的模型，違反了openai的服務條款。

但短短几天后，奧特曼宣布沒有計劃起訴deepseek，同時稱讚“deepseek是一個令人印象深刻的模型”。在推出最新的o3-mini模型後，奧特曼甚至表示，在開源方面，openai一直站在“錯誤的一邊”。

deepseek大紅大紫，逼得奧特曼前倨後恭、低頭認錯，此情此景讓不少人感到驚訝和振奮。但事實上，openai無論是產品還是戰略，都沒有被deepseek這隻“黑天鵝”所打亂。

1月底，openai推出o3-mini，並首次向免費用戶開放推理模型。測試表明，o3-mini相比上一代o1模型進步極大，多項基準測試表現優異;特別是面對高難度的物理模擬項目——如球體碰撞等，展現出對於r1及其他模型的碾壓實力。

幾天後，openai又以o3模型為基礎發布了deep research功能，號稱可以在幾十分鐘內完成人類專家數小時的工作。在涵蓋超3000道問題的綜合測試“人類最後一場考試”中，deep research實現了26.6%的正確率，遠超deepseek r1的9.4%。

o3-mini採用了許多與r1相同的技術，比如強化學習（rl）、稀疏化moe、大量監督微調（sft）等，最終成果也堪稱驚艷。然而，open並沒有在研發範式上向deepseek靠攏，而是繼續沿著“氪金”的路線狂飆。

就在拿出o3-mini對陣deepseek r1的同時，openai高調宣布了5000億美金的“星際之門”計劃。根據計劃，該計劃將在全美國打造20座超算中心;首期將投資1000億美金，在得州建設10座數據中心。

儘管奧特曼“一生之敵”馬斯克火速趕來嘲諷，信誓旦旦地說“他們沒有錢”，但星際之門的進展速度頗為驚人。計劃公開幾天後，奧特曼就曬出了“1號站點”的照片，稱之為“宏偉而美麗的建築”。

儘管星際之門得到了軟銀和甲骨文的鼎力支持，且去年營收已經高達37億美金，openai仍在繼續儲備資金。

據報導，openai正尋求以3400億美金估值融資400億美金，軟銀有望領投。而在短短三個月前，openai剛剛以1570億美金的估值，融到了66億美金。

奧特曼仿佛患上“資金短缺恐懼症”，一邊瘋狂融資，一邊大手筆花錢。

今年，谷歌、微軟、meta等均計劃投入數百億美金發展ai，力度之大遠超華爾街預期。以meta為例，扎克伯格計劃斥資至少600億美金，建設一座擁有130萬塊gpu的ai數據中心。

作為對比，據科技諮詢公司omdia測算，字節去年買了23萬塊gpu，且為性能較弱的英偉達特供版。即便如此，這一數字也遠遠超出了deepseek目前持有的晶片規模。

02

除了海外科技巨頭，國內網際網路公司也在ai大模型領域投入巨資。deepseek的“小力出奇蹟”，並沒有改寫這一局面。

一度在ai大模型領域落後的字節，近兩年灑下重金。浙商證券在一份報告中稱，2024年字節資本開支約800億元，接近bat的總和。

另有報導稱，字節2025年資本開支將超1500億，大部分用於ai。字節方面隨後否認了這一說法。

此外，字節持續“掃貨”國內ai領域的頂級人才。據《財經天下》報導，字節某些ai方向的業務團隊在招募知名院校博士應屆生時，年薪可達兩三百萬元，遠超其他大廠的100萬元左右。此外，張一鳴還親自從阿里等對手挖人。

除了研發費用和人才成本，過去一兩年，字節在b端和c端同時為ai燒錢，力圖爭奪更多企業和個人用戶。

在b端，豆包大模型自去年5月發布之後不斷降價，堪稱國內ai大模型圈子的“價格屠夫”。據統計，豆包文字大模型比行業便宜99.3%，去年12月發布的視覺理解模型比行業便宜85%。

同時，在c端，豆包依靠廣泛投流拉新。據appgrowing統計，去年4~5月，豆包投放金額預計為1500萬~1750萬元。6月上旬，豆包啟動新一輪投放活動，投放金額高達1.24億元。

在猛砸資金後，豆包的用戶量猛增，成為國內用戶最多的大模型應用。

阿里同樣在ai大模型領域持續投入大筆資金。今年總台春晚，阿里雲成為雲計算ai獨家合作夥伴。僅2024年上半年，阿里在ai基礎設施上的資本支出就達到230億元。此外，阿里花費超百億元，投資ai創業公司“六小虎”。

騰訊方面，過去六年其研發總投入超2850億元，其中很大一部分投向了ai。而在ai“六小虎”中，騰訊投資了其中五家。

僅就花錢力度而言，新bat比不過谷歌、meta、openai，但依然是國內ai大模型圈獨一檔的存在。相比之下，一直沒有融資的deepseek，仍然靠母公司幻方量化輸血;但國內量化投資近年來處於行業谷底，deepseek能夠得到的資金支持恐怕不會很多。

不過，面對deepseek的強勢崛起，新bat在繼續大手筆投錢的同時，也試圖伸出橄欖枝、構建“雙保險”。

1月底、2月初，國內主要雲服務廠商均宣布接入deepseek大模型。阿里雲宣布支持雲上一鍵部署v3和r1，百度智能雲、騰訊雲、字節旗下火山引擎等也先後宣布了類似功能。

眾所周知，deepseek採用了最“慷慨”的開源協議，並不限制第三方對於自家開源模型的商用。阿里雲等廠商第一時間接入deepseek大模型，能夠借著後者的潑天流量，為自己爭取一波關注度和新用戶。

另一方面，向deepseek伸出橄欖枝，也側面表明了大廠的心態：即便deepseek與自家ai業務存在競爭，也不妨先為我所用，並從中獲得技術、產品等方面的啟發。這些主動示好的舉動，也為雙方未來更大規模的合作留下了想像空間。

03

deepseek以“小力出奇蹟”揚名天下，但目前為止，這一頗為性感的新範式並未得到國內外大廠的全面認可與接納。砸錢、砸資源的“大力出奇蹟”，依然是大廠參與ai大模型競爭的主要打法。

與此同時，隨著競爭對手以新一代模型反擊，疊加自身規模擴大導致的種種問題，deepseek正面臨被全面反超的危險。

產品上，越來越多的用戶發掘，deepseek的大模型幻覺頻繁出現。無論是談論從a到b的最佳路線，還是解析某一首歌曲，亦或是分析某一專業話題，deepseek都存在較為嚴重的“一本正經胡說八道”問題。

大模型幻覺一直廣泛存在，也是整個ai圈子始終未能克服的難題。deepseek在這方面並沒有展現比其他模型更出色的性能，折射出僅靠大模型工程層面的創新，並不足以攻克更基礎的ai難題。

另一方面，短時間內瘋狂湧入的全球用戶，也讓deepseek有些力不從心。

據統計，deepseek自上線各大應用商店以來，短期內獲得1600萬次下載，登頂140個應用市場，最高日活躍用戶突破2200萬。由於用戶太多，deepseek的深度思考和聯網搜索功能一度暫時停止服務。

這也表明，“小力出奇蹟”或許可以大幅節約模型訓練的成本，但在模型投入使用後，必要的基礎設施成本仍然無法壓減。

從商業角度來看，ai大模型註定是一門規模越大、能力越強、成本越高的生意。巨頭們堅守“尺度定律”，其根基——算力、算法和數據三角模型依然穩固。

在deepseek崛起過程中，一個被不少人忽視的問題是，r1推理性能與o1不相上下，但在許多基準測試中不如o1。而箭在弦上的o3“滿血版”，綜合性能遠超o1。和同期其他對手相比，比如谷歌的gemini 2.0 flash，r1也並非全面領先，而是與對手各擅勝場。

在專業人士眼中，r1的真正價值是，通過多種技術創新——比如強化學習、grpo算法框架、deepseek moe等，再加上優秀的工程思想，以較低成本在部分指標接近或超越了行業最強大模型。deepseek的“小力出奇蹟”固然驚艷，但從來不是性能最強的大模型。

openai剛發布的o3-mini，在許多測試中已經反超r1，也讓國外巨頭繼續狂砸錢有了更堅實的證明。這表明，除了優秀的人才、出色的算法外，強大的算力、豐富的數據，也是構建更強大模型，乃至通往agi的必經之路。

deepseek“小力出奇蹟”證明了ai大模型的另一條發展路徑，卻並非是唯一的路徑。手握重金的科技巨頭，依然是ai大模型的主要參與者，同時也是deepseek繼續上攻的強大對手。

ai大模型遠未分出勝負，deepseek及其擁躉不能“半場開香檳”。而高性價比路線與“大力出奇蹟”路線之爭，也仍將持續下去，並在互相借鑑和融合中，推動ai大模型邁向下一個發展階段。

參考資料：

appso，《萬字揭秘deepseek：頂尖ai人才年薪千萬，訓練成本被低估》
亂彈山，《我確實低估了deepseek所引發的大面積“ai幻覺”》
億歐網，《川普孫正義組局，預砸5000億美金建“星際之門”》
it之家，《meta宣布將打造擁有 130 萬顆 gpu 的 ai 數據中心》
新智元，《o3-mini物理推理粉碎deepseek r1，openai王者歸來!全網最全實測》

原文網址：https://zh.gushiio.com/ai/168.html

deepseek勸不了谷歌們

01

02

03

相关推荐

發佈留言