deepseek勸不了谷歌們

文|字母榜,作者|彥飛,編輯|王靖

過去一個月,deepseek以大約十分之一的訓練成本,推出與openai o1性能接近的開源模型r1,“小力出奇蹟”的新範式震撼全球ai大模型行業。同時,外界對於大型科技公司動輒數百億美金的ai研發開支,也產生了越來越多的質疑。

但被“deepseek衝擊”嚇了一跳的科技巨頭,並沒有因此改弦更張。相反,他們正揮舞著支票簿,試圖靠瘋狂砸錢,重新奪取ai大模型的制高點。

2月5日,谷歌母公司alphabet發布2024年第四季度財報,營收和淨利潤均實現兩位數百分比的同比增長。引人注目的是,alphabet宣布,2025財年的資本支出將達到750億美金(約合人民幣5454億元),以繼續擴展其人工智慧戰略。

一年投入750個“小目標”研發ai,遠遠超出了華爾街599.4億美金的預期。不過,谷歌有實力如此燒錢:截至去年底,它持有現金、現金等價物及有價證券約957億美金。

稍早時候,谷歌還向ai明星創業公司anthropic追加投資10億美金。2023年至今,谷歌向這家公司累計投資35.5億美金。

財大氣粗的谷歌投身ai燒錢競賽,其他科技巨頭也不遑多讓。

今年1月初,微軟宣布將於2025財年投資800億美金,建設ai數據中心。這筆投資創下了微軟成立以來的單筆投資最高記錄。而在上一財年,微軟的資本支出超500億美金,大部分用於ai相關的基礎設施。

社交網絡巨頭meta在1月底宣布,公司將在今年投資600億~650億美金,並大幅擴張ai團隊,以期實現meta ai服務10億人、llama 4成為行業領先大模型的目標。meta創始人扎克伯格稱,今年將是“ai決定性的一年”。

openai則拉上軟銀、甲骨文、微軟、arm、英偉達預計投資5000億美金。中東人工智慧基金(mgx)等產業和投資巨頭,聯手成立“星際之門”,這些資金將被用於數據中心等ai基礎設施的建設與運營。

相比之下,國內科技巨頭面向ai大模型的砸錢規模小了一個數量級,但也動輒數百億元,且增長很快。

根據財報等公開信息,2024年前三季度,百度、阿里、騰訊的總資本開支約為人民幣867億元。金融數據服務商visible alpha預計,到2027年,bat的資本支出將達到1767億元,年複合增長率超26%。考慮到bat的重視程度,這些資本開支將有很大一部分流向ai大模型。

不難看出,科技巨頭發展ai大模型,砸錢仍然是基本武器之一。儘管deepseek證明了“小力出奇蹟”的可行性,但巨頭們出於多種原因,仍然沿著“大力出奇蹟”的路線前行。

這並非僅僅是大公司的慣性使然。openai剛剛發布的o3-mini,已經在物理推理等多項指標上反超r1,而更強大的o3標準版也已經箭在弦上。這也再次證明,“尺度定律”仍然是ai大模型的基本規則之一,而“小力出奇蹟”並非置之四海而皆準。

尚未找到“金主爸爸”的deepseek,在算力、數據、資金和資源方面比不上巨頭,正面臨被後來者強行超車的危險。不過,r1的成功,也證明了“小力出奇蹟”的可行。在deepseek震動全球ai圈後,巨頭青睞的“砸錢”與“小力出奇蹟”的路線之爭仍在繼續,遠未分出勝負。

01

面對快速崛起的deepseek,美國科技巨頭表面上對其技術、產品和方法論讚嘆不已,但在戰略層面上,並沒有對其“小力出奇蹟”的策略亦步亦趨。

恰恰相反,在deepseek席捲全球ai大模型領域後,巨頭們的砸錢邁向了新高度。

以openai為例,奧特曼起初對於deepseek有所懷疑,稱“並不新穎,我們早已具備這一水平的模型”,且“被嚴重誇大了”。openai甚至在1月底表示,deepseek涉嫌使用openai專有模型訓練自己的模型,違反了openai的服務條款。

但短短几天后,奧特曼宣布沒有計劃起訴deepseek,同時稱讚“deepseek是一個令人印象深刻的模型”。在推出最新的o3-mini模型後,奧特曼甚至表示,在開源方面,openai一直站在“錯誤的一邊”。

deepseek大紅大紫,逼得奧特曼前倨後恭、低頭認錯,此情此景讓不少人感到驚訝和振奮。但事實上,openai無論是產品還是戰略,都沒有被deepseek這隻“黑天鵝”所打亂。

1月底,openai推出o3-mini,並首次向免費用戶開放推理模型。測試表明,o3-mini相比上一代o1模型進步極大,多項基準測試表現優異;特別是面對高難度的物理模擬項目——如球體碰撞等,展現出對於r1及其他模型的碾壓實力。

幾天後,openai又以o3模型為基礎發布了deep research功能,號稱可以在幾十分鐘內完成人類專家數小時的工作。在涵蓋超3000道問題的綜合測試“人類最後一場考試”中,deep research實現了26.6%的正確率,遠超deepseek r1的9.4%。

o3-mini採用了許多與r1相同的技術,比如強化學習(rl)、稀疏化moe、大量監督微調(sft)等,最終成果也堪稱驚艷。然而,open並沒有在研發範式上向deepseek靠攏,而是繼續沿著“氪金”的路線狂飆。

就在拿出o3-mini對陣deepseek r1的同時,openai高調宣布了5000億美金的“星際之門”計劃。根據計劃,該計劃將在全美國打造20座超算中心;首期將投資1000億美金,在得州建設10座數據中心。

儘管奧特曼“一生之敵”馬斯克火速趕來嘲諷,信誓旦旦地說“他們沒有錢”,但星際之門的進展速度頗為驚人。計劃公開幾天後,奧特曼就曬出了“1號站點”的照片,稱之為“宏偉而美麗的建築”。

儘管星際之門得到了軟銀和甲骨文的鼎力支持,且去年營收已經高達37億美金,openai仍在繼續儲備資金。

據報導,openai正尋求以3400億美金估值融資400億美金,軟銀有望領投。而在短短三個月前,openai剛剛以1570億美金的估值,融到了66億美金。

奧特曼仿佛患上“資金短缺恐懼症”,一邊瘋狂融資,一邊大手筆花錢。

今年,谷歌、微軟、meta等均計劃投入數百億美金發展ai,力度之大遠超華爾街預期。以meta為例,扎克伯格計劃斥資至少600億美金,建設一座擁有130萬塊gpu的ai數據中心。

作為對比,據科技諮詢公司omdia測算,字節去年買了23萬塊gpu,且為性能較弱的英偉達特供版。即便如此,這一數字也遠遠超出了deepseek目前持有的晶片規模。

02

除了海外科技巨頭,國內網際網路公司也在ai大模型領域投入巨資。deepseek的“小力出奇蹟”,並沒有改寫這一局面。

一度在ai大模型領域落後的字節,近兩年灑下重金。浙商證券在一份報告中稱,2024年字節資本開支約800億元,接近bat的總和。

另有報導稱,字節2025年資本開支將超1500億,大部分用於ai。字節方面隨後否認了這一說法。

此外,字節持續“掃貨”國內ai領域的頂級人才。據《財經天下》報導,字節某些ai方向的業務團隊在招募知名院校博士應屆生時,年薪可達兩三百萬元,遠超其他大廠的100萬元左右。此外,張一鳴還親自從阿里等對手挖人。

除了研發費用和人才成本,過去一兩年,字節在b端和c端同時為ai燒錢,力圖爭奪更多企業和個人用戶。

在b端,豆包大模型自去年5月發布之後不斷降價,堪稱國內ai大模型圈子的“價格屠夫”。據統計,豆包文字大模型比行業便宜99.3%,去年12月發布的視覺理解模型比行業便宜85%。

同時,在c端,豆包依靠廣泛投流拉新。據appgrowing統計,去年4~5月,豆包投放金額預計為1500萬~1750萬元。6月上旬,豆包啟動新一輪投放活動,投放金額高達1.24億元。

在猛砸資金後,豆包的用戶量猛增,成為國內用戶最多的大模型應用。

阿里同樣在ai大模型領域持續投入大筆資金。今年總台春晚,阿里雲成為雲計算ai獨家合作夥伴。僅2024年上半年,阿里在ai基礎設施上的資本支出就達到230億元。此外,阿里花費超百億元,投資ai創業公司“六小虎”。

騰訊方面,過去六年其研發總投入超2850億元,其中很大一部分投向了ai。而在ai“六小虎”中,騰訊投資了其中五家。

僅就花錢力度而言,新bat比不過谷歌、meta、openai,但依然是國內ai大模型圈獨一檔的存在。相比之下,一直沒有融資的deepseek,仍然靠母公司幻方量化輸血;但國內量化投資近年來處於行業谷底,deepseek能夠得到的資金支持恐怕不會很多。

不過,面對deepseek的強勢崛起,新bat在繼續大手筆投錢的同時,也試圖伸出橄欖枝、構建“雙保險”。

1月底、2月初,國內主要雲服務廠商均宣布接入deepseek大模型。阿里雲宣布支持雲上一鍵部署v3和r1,百度智能雲、騰訊雲、字節旗下火山引擎等也先後宣布了類似功能。

眾所周知,deepseek採用了最“慷慨”的開源協議,並不限制第三方對於自家開源模型的商用。阿里雲等廠商第一時間接入deepseek大模型,能夠借著後者的潑天流量,為自己爭取一波關注度和新用戶。

另一方面,向deepseek伸出橄欖枝,也側面表明了大廠的心態:即便deepseek與自家ai業務存在競爭,也不妨先為我所用,並從中獲得技術、產品等方面的啟發。這些主動示好的舉動,也為雙方未來更大規模的合作留下了想像空間。

03

deepseek以“小力出奇蹟”揚名天下,但目前為止,這一頗為性感的新範式並未得到國內外大廠的全面認可與接納。砸錢、砸資源的“大力出奇蹟”,依然是大廠參與ai大模型競爭的主要打法。

與此同時,隨著競爭對手以新一代模型反擊,疊加自身規模擴大導致的種種問題,deepseek正面臨被全面反超的危險。

產品上,越來越多的用戶發掘,deepseek的大模型幻覺頻繁出現。無論是談論從a到b的最佳路線,還是解析某一首歌曲,亦或是分析某一專業話題,deepseek都存在較為嚴重的“一本正經胡說八道”問題。

大模型幻覺一直廣泛存在,也是整個ai圈子始終未能克服的難題。deepseek在這方面並沒有展現比其他模型更出色的性能,折射出僅靠大模型工程層面的創新,並不足以攻克更基礎的ai難題。

另一方面,短時間內瘋狂湧入的全球用戶,也讓deepseek有些力不從心。

據統計,deepseek自上線各大應用商店以來,短期內獲得1600萬次下載,登頂140個應用市場,最高日活躍用戶突破2200萬。由於用戶太多,deepseek的深度思考和聯網搜索功能一度暫時停止服務。

這也表明,“小力出奇蹟”或許可以大幅節約模型訓練的成本,但在模型投入使用後,必要的基礎設施成本仍然無法壓減。

從商業角度來看,ai大模型註定是一門規模越大、能力越強、成本越高的生意。巨頭們堅守“尺度定律”,其根基——算力、算法和數據三角模型依然穩固。

在deepseek崛起過程中,一個被不少人忽視的問題是,r1推理性能與o1不相上下,但在許多基準測試中不如o1。而箭在弦上的o3“滿血版”,綜合性能遠超o1。和同期其他對手相比,比如谷歌的gemini 2.0 flash,r1也並非全面領先,而是與對手各擅勝場。

在專業人士眼中,r1的真正價值是,通過多種技術創新——比如強化學習、grpo算法框架、deepseek moe等,再加上優秀的工程思想,以較低成本在部分指標接近或超越了行業最強大模型。deepseek的“小力出奇蹟”固然驚艷,但從來不是性能最強的大模型。

openai剛發布的o3-mini,在許多測試中已經反超r1,也讓國外巨頭繼續狂砸錢有了更堅實的證明。這表明,除了優秀的人才、出色的算法外,強大的算力、豐富的數據,也是構建更強大模型,乃至通往agi的必經之路。

deepseek“小力出奇蹟”證明了ai大模型的另一條發展路徑,卻並非是唯一的路徑。手握重金的科技巨頭,依然是ai大模型的主要參與者,同時也是deepseek繼續上攻的強大對手。

ai大模型遠未分出勝負,deepseek及其擁躉不能“半場開香檳”。而高性價比路線與“大力出奇蹟”路線之爭,也仍將持續下去,並在互相借鑑和融合中,推動ai大模型邁向下一個發展階段。

參考資料:

  • appso,《萬字揭秘deepseek:頂尖ai人才年薪千萬,訓練成本被低估》
  • 亂彈山,《我確實低估了deepseek所引發的大面積“ai幻覺”》
  • 億歐網,《川普孫正義組局,預砸5000億美金建“星際之門”》
  • it之家,《meta宣布將打造擁有 130 萬顆 gpu 的 ai 數據中心》
  • 新智元,《o3-mini物理推理粉碎deepseek r1,openai王者歸來!全網最全實測》

原文網址:https://zh.gushiio.com/ai/168.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *