DeepSeek榮光下:落寞的“六小龍”
文章來源:深網騰訊新聞
Image source: Generated by AI
人類的悲歡並不相通。 從2016年開啟的人工智慧元年,AI產業已經歷好幾輪洗牌,借著ChatGPT的東風,DeepSeek如同鯰魚一般攪動了整個大模型市場,同為大模型創業公司並被業界視為新貴“六小龍”的廠商們,與其相比,境遇堪稱東邊日出西邊雨。
DeepSeek年前推出低成本、效能媲美GPT-4o的DeepSeek-V3震驚業界後,其接著在1月20日發佈R1模型,上線六天后登頂蘋果App Store全球下載榜首,上線一個月累計下載量超1.1億次。 在這期間各大雲廠商迅速上線開源版V3和R1,百度搜索、微信等產品都在積極擁抱DeepSeek。
而和DeepSeek同時期發佈的Kimi全球强化學習模型k1.5、階躍推理模型Step R-mini,在模型能力上諸多層面接近o1,但依然淹沒在了DeepSeek火爆的輿論中。
與DeepSeek的喧鬧相比,“六小龍”也是接二連三的爆出消息:零一萬物進一步折開、月之暗面預算和仲裁案未和解、MIniMax又一高管離職……
而這背後還有失意的VC們:真金白銀支持的項目,沒有一個達到DeepSeek這樣的熱度。 現時,“六小龍”中已經4家超半年沒有融資消息釋放。 2024年業界稱“六小龍”中已有兩家掉隊,2025年,下一個掉隊的是誰?
只剩三家繼續紮根大模型
DeepSeek的爆火並非沒有徵兆,自2023年11月2日推出首個模型DeepSeek Coder後,一年多時間上線了超10個不同版本的模型。 其中去年5月發佈的V2模型,效能上比肩GPT-4 Turbo,價格卻只有GPT-4的1%,囙此DeepSeek被稱作“價格屠夫”“AI界拼多多”,同時掀起了大模型行業的第一輪價格戰。
2025年1月27日DeepSeek超越ChatGPT,登頂中國區和美國區蘋果APP Store免費榜,引發全球關注。 讓DeepSeek有如此成就的是其推理大模型DeepSeek-R1。 根據DeepSeek公佈的資訊,R1在多項權威測試中得分與o1正式版接近,部分測試中得分還超過o1正式版。
榜單評分外,開源+性價比則是讓DeepSeek引發潑天熱度的重要組合拳。 受到DeepSeek的衝擊,曾經的閉源信徒百度創始人李彥宏也宣佈加入開源隊伍,OpenAI創始人山姆. 奧特曼也反思道,公司在開源領域的策略上一直處於“錯誤的一方”。
大模型“六小龍”中的MiniMax在1月15日發佈了首個開源模型,其創始人閆俊傑在接受《晚點》採訪時也表示,“第一次創業很多經驗不具備,如果可以重新選,應該第一天就開源。”其他五小龍中,只有智譜是最早開源閉源兩條腿走路的。 經過近兩年的摸爬滾打後,“六小龍”發展方向已南轅北轍。
零一萬物是第一家公開大幅調整的基礎大模型公司,先是裁撤了預訓練算灋團隊和Infra團隊,部分人員以跳槽形式加入阿裡,後宣佈與阿裡雲、蘇州高新區分別聯合成立產業大模型聯合實驗室、產業大模型基地。
人員方面,模型訓練負責人黃文灝、負責大模型API開放平臺的藍雨川、生產力產品負責人曹大鵬都相繼離職。 試圖留在牌桌上的零一萬物,掩蓋不住在這一輪大模型競賽中的頹勢。
百川智慧則在2024年明確了走醫療賽道,近期上線了首個“AI兒科醫生”。 在To B的商業化上百川則似乎不太順利,其聯合創始人、商業化負責人洪濤年前已經離職。 據百川一比特員工告知的確不及預期,“現在有了DeepSeek後,今年的壓力只增不减。”
To B商業化負責人離職的還有MiniMax的魏偉,此前魏偉接受採訪時表示,很多B端客戶不會輕易掏這個錢,去支撐大模型公司的營收,只能基於研發能力、算灋能力來幫助客戶在實際場景中對齊輸出效果,也印證了大模型商業化並非易事。
如此看來,仍在專注於大模型技術創新和追求AGI的,僅剩下月之暗面、智譜、階躍星辰。 受到DeepSeek的影響,階躍星辰也加入了開源陣營,只是與DeepSeek重點在文字模型上不同的是,階躍星辰最新開源的是兩款多模態模型——Step-Video-T2V、 Step-Audio。
2月23日淩晨,月之暗面發佈最新論文《Muon is Scalable for LLM Training》,並開源MoE模型Moonlight,模型啟動參數僅需3B。 不少業內人士認為這是在“截胡開源周”,因為早前DeepSeek宣佈將連續5天發佈開源項目。
對月之暗面而言,火燒眉毛的或許是其大手筆投流的Kimi產品。
燒錢投流難成榜一大哥
與大模型“六小龍”一樣DeepSeek也有同名C端產品,在上線後的第一周並沒有在市場上引起過多的關注。 據QuestMobile向媒體披露的資料顯示,2025年1月13日至1月19日,DeepSeek App周下載量僅為28.5萬,遠不及豆包(452萬)以及Kimi(155.7萬)。
在2025年1月20日R1發佈後,DeepSeek下載量開始陡峭式增長,Sensor Tower研究顯示DeepSeek在發佈會18天內下載量超1600萬次,幾乎是OpenAI的ChatGPT首次發佈時的900萬次的兩倍。
訪問量激增,一度讓DeepSeek閃崩,而即便如此,增長的勢頭依然很猛,月下載量超1.1億。 DeepSeek的光芒再也沒有哪家可以視而不見,2月13日位元組跳動內部全員會上,CEO梁汝波談及DeepSeek時,反思跟進速度不够,今年要追求智慧上線。
騰訊的微信灰度測試接入了DeepSeek的AI蒐索,在使用量超預期後又調用了AI應用元寶支持微信蒐索。 2月22日,騰訊元寶超越位元組的豆包,升至中國區蘋果免費APP下載排行榜第二,DeepSeek繼續位居榜首。
“榜一榜二大哥”在短短一個月內易主,迫使燒錢換增長的豆包和Kimi優勢不再。 兩者的區別是,前者是含著“金鑰匙”出生的貴族,後者則是“創業新貴”。 此前有媒體測算,僅在iPhone通路,Kimi每天的投放金額接近20萬,豆包則為248萬。
在DeepSeek的影響下,月之暗面近期被爆大幅削减產品投放預算,包括暫停多個安卓通路的投放,以及協力廠商廣告平臺的合作。 據內部人士向《AI光年》透露,推廣確實做了相應調整,“有自然新增,但無法和DeepSeek的漲勢相比。”
kimi當下的煩惱可不止這些:「暗湧Waves」獨家獲悉,擱置頗久的Kimi仲裁案,並未和設想的一樣,完成和解,而是進入到仲裁案的下一流程中。 據知情人透露:Kimi仲裁案的雙方,迴圈智慧老股東和楊植麟等,已分別於1月底和2月下旬,在HKIAC(香港國際仲裁中心)完成繳費,現時組庭也已完成。 而整個事件背後更關鍵的主角張予彤,或將被另外單獨提起訴訟。
對To C產品同樣予以厚望的還有MiniMax,原因是其旗下藝員產品Talkie2024年上半年成為美國下載量第四的AI應用,使之吃到了甜頭。 但好景不長,12月中旬Talkie在美國市場的蘋果應用商店中悄然消失,而安卓平臺則未受影響。
階躍星辰、零一萬物、智譜AI和百川智慧也都有自家的AI應用產品,但根據AI產品榜顯示2025年1月,月活前20的AI應用中沒有一家是與這四家廠商相關的。 此前百川智慧的員工告訴《AI光年》,“百小應的用戶留存和增長很差也不意外,我們基本不做廣告投放,先讓其他家燒錢完成用戶教育。”
現時DeepSeek、騰訊元寶、位元組豆包霸佔了蘋果免費APP下載排行榜前三。 大模型“六小龍”想要上榜,競爭只會更激烈,現時排名第七的納米蒐索,周鴻禕正在親自下場“帶貨”。
另外還有一個不容忽視的對手就是阿裡,AI應用通義併入阿裡智慧資訊事業群後,近期阿裡AI To C業務開啟了大規模招聘,崗位達數百個,集中在AI大模型相關的產品、技術研發崗位。 前有狼後有虎,正是大模型“六小龍”當下處境的真實寫照。
當科技故事不再浪漫、商業化不及預期、產品月活用戶增長與投入不成正比,大模型“六小龍”理想豐滿,現實骨感。
下一輪融資門檻提高
大模型預訓練燒錢是公認的事實,李開複曾透露,一次預訓練成本約三四百萬美元,即便是成本更低的Yi-Lightning,在訓練時也用了2000張GPU,耗時一個半月,花費三百多萬美元。
即便標榜低成本的DeepSeek,在前期的投入也是難以估量的,協力廠商機构SemiAnalysis推算,DeepSeek實際擁有龐大的算力儲備:共堆砌了6萬張英偉達GPU卡,其中包括1萬張A100、1萬張H100、1萬張“特供版”H800以及3萬張“特供版”H20。
“通用大模型的訓練成本,我們預估的大概10億美金左右,這僅僅是算力部分,還沒算另外兩個很花錢的部分,一個是數據,一個是人力成本,現在全球大模型領域的人才,是非常稀缺的。”將門創投創始合夥人、前微軟創投大中華區負責人杜楓博士曾告訴作者。
由於需要如此高昂的投入,導致很長一段時間裏業內流行一種說法:投資大模型企業的入場券是1億美金。 這句話背後的另外一個訊號是,一個大模型創業公司拿不到融資,是難以活下去的。
2023年百模大戰掀起後,幾乎每隔一個月都會有融資消息釋放出來,但隨著AI泡沫論甚囂塵上,2024年9月起,很長一段時間沒有數億級的熱錢流向大模型“六小龍”。 直到2025年春節前,智譜和階躍星辰先後宣佈拿到了“過冬錢”,前者宣佈完成新一輪30億元人民幣融資,後者則完成B輪數億美元融資。
“六小龍”中另外4家已經距離上一次融資動態發佈有超半年:MiniMax去年3月官宣完成6億美元B輪融資、百川智慧去年7月獲得50億元A輪融資、零一萬物去年8月完成新一輪數億美元融資、月之暗面去年8月完成3億美元融資。
春節期間,DeepSeek火爆全球,輿論毫不吝嗇誇獎DeepSeek及其創始人梁文峰。 在創投圈關於DeepSeek會不會開啟融資、估值多少,近日一直有不少消息流傳出來。
此前有消息稱阿裡將以100億美元估值,投資10億美元占股10%。 對此阿裡副總裁顏喬很快通過朋友圈闢謠稱,“外界流傳阿裡投資DeepSeek的資訊是假消息”。 而後外媒稱“DeepSeek首次考慮籌集外部資金”,DeepSeek相關人士闢謠,融資消息均為謠言。
“不少投資人都直接或者托關係在約梁文峰,我預測估值應該是遠超於現時‘大模型六小龍’的。”中金資本一比特投資人表示,“DeepSeek成為了對標對象,六小龍要在一級市場拿到新融資,門檻顯然更高了。”
事實上,自大模型創業潮掀起以來,行業內普遍不太相信“六小龍”最後都能作為獨立“大模型公司”生存下來的。 “六小龍”中幾比特創始人也在公開場合表達過類似的觀點,比如MiniMax創始人閆俊傑認為未來全球只會剩下5家大模型企業。
“中國一定會有自己的ChatGPT。這跟搜尋引擎一樣,我們有自己的合規要求。但是中國版的ChatGPT只會在5家公司裏產生:BAT+位元組+華為。” 迅雷創始人、遠望資本程浩曾告訴作者。
持續爆火下,本就走向分化的“六小龍”將加速洗牌。
原文網址:https://zh.gushiio.com/ai/2860.html