“我勸過梁文鋒很多次，deepseek 要融資”

2025年，ai應用會迎來爆發之年。

作者：劉雪楠，投中網

“我勸過梁文鋒很多次，deepseek 要融資”插图

爆火的deepseek，足以載入史冊。很多年後人們回想起這一刻，結論或許是從2022年底openai發布chagpt，中國ai發展的主流敘事始終是“追趕”，而deepseek橫空出世，將“追趕“變成了“創新”和“普及”，甚至是“重塑”和“超越”。

但vc們顯然是失意的，因為包括“大模型六小龍”在內，他們支持的大模型創業項目，自始沒有一個達到deepseek這樣的全球熱度，幾乎與deepseek同時發布的，kimi全新強化學習模型k1.5，雖然是全球繼openai之後首個多模態類o1模型，在諸多層面能力接近o1甚至是超越，但沒有濺起多大水花，同樣淹沒在了deepseek狂熱的輿論中。

一切或許要從deepseek創始人梁文鋒登上新聞聯播，成為總理的座上賓開始。他在這次會上說了什麼，可能不是最重要的，輿論關心的是，為什麼一個留著長劉海的80後，會突然得到高層的關注？再看看朋友圈，哦？做量化基金的。更好奇了。

作為長期跟蹤ai產業的一級市場觀察者，輿論發酵速度低於我的預期，程度卻遠超我的想像。1月20日，周日晚間梁文鋒登上新聞聯播，發酵了足足一周，顛覆全世界的“deepseek r1 550萬結雅訓練成本”，只讓周五英偉達的股價下跌3.12%，轉過頭來的下周一，卻讓a股創業板收穫了根-2.73%的大陰線。當時我的評價是，deepseek打了英偉達們一個嘴巴，轉頭卻更狠地踹了a股一腳。

打臉來得很快，1月27日當天，英偉達低開低走下跌接近17%，全世界的算力一片哀嚎，高喊“狼來了”，deepseek就是那條狼。當然了，我個人的榮辱不算什麼，打臉也是經常的事。但中國vc卻幾乎成了ai算力之外，最大的“受害者”，輿論不吝給予梁文鋒和他的理想主義最大程度的讚揚，同時也施加給中國vc極致的羞辱和討伐，比如小紅書有篇帖子，標題為“deepseek再次證明，中國vc就是個笑話”。更不幸的是，點讚還過千了。

“我勸過梁文鋒很多次，deepseek 要融資”插图1

但我還是要旗幟鮮明地說一句，道德層面的討伐很低級，這個階段討論“vc為什麼沒投到deepseek”，除了情緒上的宣洩，也沒太大意義，沒投到就是沒投到，任何客觀或主觀的原因都像是辯解。進一步的反思雖然非常有必要，但也不是立刻，縱觀國內一級市場，從lp到gp，再到募投管退的各個環節，大量“頑疾”很難短時間根除，很多也根本不是vc/pe們能決定的。

我認為亟待討論的是現在和未來，至少包括三個問題：現在deepseek能不能投到以及估值多少？deepseek對此前已經投資的各類ai項目有什麼影響？deepseek引發的ai產業變革，對vc下一步在ai的資本部署，有哪些積極指引？

一、deepseek融資？梁文鋒“打太極”

關於deepseek估值多少以及能不能投到，這兩天已經有不少消息流出了。就在昨天晚間，有消息稱阿里將以100億美金估值，投資10億美金占股10%。對此阿里副總裁顏喬很快通過朋友圈闢謠稱，“外界流傳阿里投資deepseek的信息是假消息”。不過，一位可能接近此次交易的投資人向投中網表示，“現在比較敏感，他們也不方便說，要再等等”，因此這筆被否認的交易，不排除還可能存在一些變數。

而在此之前，就有某ai投資人對投中網表示，deepseek正與投資人接觸，他透露的估值是80億美金，與前述“阿里給出100億美金估值”的“假消息”有差距，而不管是80億美金，還是100億美金，deepseek的估值目前已遠超“大模型六小龍”中最高的minimax—— 40億美金。

據投中網了解，這幾天有不少投資人，都直接或間接找到梁文鋒確認是否正式啟動融資，估值也大致圍繞上述範圍，但梁文鋒並未給出承認或否認的正面回應，而是以“打太極”為主。也有不少投資人找到deepseek負責ir的相關人士詢問是否正在進行融資，截至昨天都得到了否認的結果。

另外還有一層信息是，deepseek內部也有人“勸過梁文鋒很多次，deepseek要不要融資”。這至少意味著兩點，一是對於是否進行融資，deepseek內部意見也許並不統一，但決定權一定在梁文鋒，只有他握著開啟寶藏的鑰匙;二是梁文鋒近期很可能與一些投資人或產業資本有過接觸，但維持在一個極小的圈子。

比如多次對投資大模型嗤之以鼻的朱總，就肯定不在這個圈子中，即使deepseek讓他轉變了對大模型的態度，表示“我肯定會投啊”，但投中網向他詢問是否聽說deepseek融資的消息時，得到的回覆是“沒有”。但朱總畢竟是朱總，對vc應不應該參與deepseek融資的重點拿捏得很準，“這個價格已經不太重要了，關鍵是參與在這裡面”。

扯遠了，總之現在vc對於deepseek融資這件事，預期是很高的，多位投資人從c端流量承接、激增的帶寬和算力成本、未來繼續scale up，以及最重要的，留住人才以保持持續的創新能力等角度，向投中網敘述了deepseek融資的必要性。

當然了，還是那句話，鑰匙只在梁文鋒，以及可以決定deepseek能否走向更大敘事可能的人的手中。接下來的，就是時間問題了。但從我個人出發，更樂於看到deepseek能否再堅持一段時間，一方面時間越長，期間博弈一定更加精彩;另一方面如某投資人在朋友圈中所說，“deepseek若能保持private company to build public good的純粹，這種優美是稀缺的。& rdquo;

二、“無論如何要跪進去一些份額”

deepseek在春節前後的出圈，令大模型投資人心情複雜。驚喜在於，中國大模型企業能夠這麼快趕上世界水平，恐慌則在於，整個ai投資的邏輯可能會發生巨大的變化。

“至少在國內，deepseek已經贏了這場戰爭。它正在進行的一輪融資估值已經達到80億美金，是行業里估值最高的一家，這都得搶破頭或只能定向融。& rdquo;一位ai投資人告訴我。

deepseek此前並未開放融資，初期資金由幻方量化支持。按照梁文鋒在訪談中的說法，他也嘗試過找資方，但礙於自己專注於研究的想法和vc更多考慮商業化的訴求不相符，於是斷了念想。與之形成鮮明對比的是，爆火之後的deepseek開始被投資人包圍。

鋒芒已露，縱然想要善刀而藏也是難事，在前述投資人看來，如今融資也是形勢所迫，不得已而為之。& ldquo;現在dau飆漲到2000萬，流量來得如此迅猛，已經明顯承接不住。如果deepseek只是開發模型，不做應用，那沒問題，但做了應用，現在每一天都要花幾百甚至上千萬出去，必須考慮伺服器、網絡資源之類的問題。另外，已經跑通了單點，現在要去scale up，scale up也是要花錢的。& rdquo;

但這一消息並未得到當事方的承認。面對最近前來問詢的投資人，deepseek融資負責人給出的說法仍然是，“沒有融資打算”。昨晚“阿里計劃以100億美金的估值，投資10億美金認購deepseek10%股權”的消息也被阿里副總裁明確否認，而這不妨礙阿里巴巴美股盤前一度漲超6%。

一筆投得出幾十億的國資和大廠，被認為是最有可能入局deepseek融資局的候選人。一些有意思的細節是，幻方杭州總部所在的匯金國際大廈，與浙江省金控在同個寫字樓不同座，目前已經擠滿了記者和投資人，deepseek北京辦公室所在的融科大廈，又跟百度投資在一座樓上。

一位省級國資的投資人對投中網表示，最近他們機構“從上到下”，都在跟deepseek方面接觸，無論如何希望“跪一部分份額”進去，但deepseek口咬得很死，堅稱目前並沒有開放融資窗口。

事實上，對ai圈子裡的人來說，deepseek不算神秘，疫情期間囤了一萬張a100的江湖傳說流傳甚廣。我從投資人處了解到的信息是，2023年初，deepseek曾經聊過一圈大模型公司和投資機構，也包括小紅書的創始人毛文超。不過在今年1月，deepseek和小紅書達成合作，目前deepseek入駐的官方社交媒體，也只有小紅書、x、微信公眾號。顯然，梁文鋒對小紅書是有些偏愛的。

跟梁文鋒的說法一樣，聊完以後，梁文鋒和vc們發現大家的目標並不一致。& ldquo;vc都是幫lp管錢，都得賺錢，所以就談不到一塊去。& rdquo;2023年7月，梁文鋒成立杭州深度求索（deepseek）人工智慧基礎技術研究有限公司，專注於通用人工智慧與大模型研發。巧的是，字節開始投入ai研發也是在那個時間點。

另外的細節是，2022年左右，量化基金被政策持續打壓，幻方管理規模也持續縮減。而梁文鋒在創立deepseek前除了接觸過vc外，因為手握大量的gpu算力集群，再加上樑文鋒自己的錢，曾想通過投資入股、找雲廠商合作等方式，將手中富裕的算力“用出去”，還為此招了兩個人專門做戰投，看了大量包括低空等在內的科技項目，但幻方的結論是，“外面能做的，自己也能做”，多數項目“意思不大”，最終“一個也沒投”。後來基於梁文鋒技術理想主義的情懷，deepseek應運而生。

大模型市場的變化瞬息萬變，deepseek很快將成為攪動市場的鲶魚。& ldquo;我去看各種ai項目的時候，基本上都會問對方在用哪些基座，覺得哪些模型比較好，到2024年的時候，大家的普遍反饋已經是通義、豆包和deepseek。& rdquo;一家投資機構的合伙人eric（化名）告訴我。

deepseek在大眾層面的普及來源於兩個模型。1月13日，deepseek推出app版本，使用v3大模型，這是一個全開源moe（混合專家）模型。deepseek報告稱其v3模型的訓練成本僅為600萬美金，只有llama 3的1%。1月20日，deepseek發布開源大模型r1，又以極低訓練成本達到與openai最新o1模型相近的性能。一天後，deepseek登頂蘋果中美地區應用商店免費下載排行榜。

“應該沒有人能預想到deepseek會這麼火。發布v3的時候，業內都注意到了，但因為當時app沒上線，所以還沒有引爆c端。當應用發布之後，普通人都覺得產品效果好，deepseek便開始出現在街談巷議之中。自然流量和買來的流量，這時候差異一下就顯出來了。& rdquo;一家機構的合伙人jared（化名）說。

任何產品的火爆離不開天時地利人和，時點很重要。在eric看來，當下ai的上升曲線已經變緩，預訓練的數據差不多用光了，大語言模型能力不再容易上升，只能轉換思路轉向以openai的o1和deepseek的r1為代表的推理模型。& ldquo;這個時候，是選擇繼續砸大錢去搏一個上限，還是不追求那5%的進步而是把成本降到原來的1/10？deepseek代表的降成本路線恰恰出現在一個合適的時間點上。& rdquo;

三、“六小龍”不走差異化之路將很難再融到錢

“國內大模型訓練的綜合成本（數據，人工，電力和算力）比美國低，而deepseek因為其出色的工程能力，更是把成本控制到極致。在未來兩個季度里，deepseek會成為行業基準線，降成本是大勢所趨。如果為了提高5%的上限，再花10倍的錢，從資本和商業角度考量，這是不值當的。& rdquo;jared認為。

大模型過去燒錢兇猛，研發成本降低，首先動搖的是對這些企業的估值邏輯。

eric認為，deepseek之所以在海外引發這麼高的恐慌情緒，正是因為那些大公司的估值要重新評價了。“過去大家相信，大模型本質上是資本的競爭，正如我們說2023年5月之前如果沒拿到1億美金，在國內就別搞大模型了。但當大家發現不需要那麼多錢，大模型公司的估值恐怕很難撐得住。長期來看，估值是建立在你創造的價值基礎上，短期來看取決於大家認為你的壁壘有多高。& rdquo;

王榮進則認為，deepseek出現後會不會對現有大模型公司估值產生影響，現在還不好說，但他們極低的成本對業內還是帶來衝擊。如果大模型企業能通過其他方式去創新降低訓練或推理成本，估值受到影響或許比較有限。& ldquo;不排除國內的公司通過其他方式去創新達到類似的效果，關於這一點也值得期待。& rdquo;

jared的態度比較悲觀。他相信，如果“六小龍”不走差異化之路，將很難再融到錢。大廠有資本加持，可以繼續戰鬥，但創業公司如果在單一項目上卷不到第一，基本上沒有太大意義。& ldquo;當然，只要有差異化，並且不燒錢，苟活著也是個出路。& rdquo;

事實上，“六小龍”已經分化出不同的路徑。有的公司仍在燒錢訓練大模型，比如我了解到某公司去年收入3個億左右，但成本卻高達20多億。有的公司已經放棄，比如零一萬物已與阿里雲成立“產業大模型聯合實驗室”，不再追求訓練超級大模型，但會繼續訓練參數適中的更快、更便宜的模型，基於後者打造可以賺錢的應用。

“當預訓練結果已經不如開源模型時，每個公司都不應該執著於預訓練。& rdquo;在《晚點》訪談中，李開復如是說。也有的公司投入更多精力在多模態上，比如minimax。還有的公司轉向紮根垂直行業，比如百川的重點已經落在了做醫療大模型上。jared認為，最終這些大模型企業估值是否重構還是取決於商業化的成果，deepseek如果融資也會面臨一樣的商業化問題。

四、關於deepseek的共識和分歧

deepseek已經被一些人視為“國運”的象徵，但能否獨占鰲頭在投資人眼中仍有分歧。

jared相信，大廠很難做出deepseek那樣的創新。原因在於，大廠資源過剩，反而就沒有人會想著如何極致地優化成本。同時內部賽馬嚴重，更多是在卷人，而不是卷事情。kpi通常被簡化為“實現多少dau”這一通過買流量就能實現的目標，也會導致大家很難扎紮實實做技術創新。而做對沖基金出身的人對資源和成本看得很重，總是在想著怎麼工程化創新降低成本，這跟大廠的基因和技能點也不一樣。

但eric認為，在那些明星創業公司里deepseek會長期居於第一位，但還很難說deepseek比阿里和字節的大模型厲害，從所採用的技術範式上來看，理論上openai的o1的範式上限要高於deepseek的r1。& ldquo;到底應該省錢，還是追求高上限，這是一個選擇問題。放在國內來講，大家的能力都很強，只不過側重點不一樣，豆包和通義都做了多模態模型，deepseek做得更聚焦，只做語言模型，它最強大的地方還是在於省錢。& rdquo;

春節期間，軒元資本創始合伙人王榮進一直在找資料研究deepseek的底層邏輯。在他看來，deepseek在應用、工程、架構等多個方面做了很多創新。至於市場討論的借鑑方面，他覺得這也沒什麼，openai的transformer源於google，蘋果的ios部分參考了富士施樂，微軟的microsoft的gui部分參考的是富士施樂的xerox alto，大家都是站在巨人的肩膀上更進一步。& rdquo;

外媒的描述更有意思。有的媒體將openai和deepseek之間的不同路徑比作17世紀英國內戰中“錯誤但浪漫”的保皇黨與“正確但令人反感”的圓顱黨之間的衝突。人工智慧保皇黨不惜一切代價追求agi，而人工智慧圓顱黨專注於更實際的目標，儘可能高效地解決特定問題。海外有關大模型融資的最新消息是，ilya sutskever創立的safe superintelligenc正以200億美金估值洽談融資——仍然是一個昂貴的價格。

瀰漫在行業上空的還是一團迷霧。& ldquo;連著幾年，大模型在年初都有讓人震撼的新進展，而且往往年初和後面發生的事情脫節，所以現在誰也不能預測年底到底會發生什麼。& rdquo;jared說。

eric認為，r1代表的這種後訓練模型模式剛剛開始，deepseek只是在中間提出了一個分叉，到底會跑成什麼樣還不知道，但毫無疑問創業的需求會急劇加大。在他看來，deepseek更重要的意義在於帶來一種全新的價值觀。& ldquo;他們的目標不是說賺多少錢，而是能不能做出有價值的創新，這個價值觀值得中國企業尤其是大公司思考。& rdquo;

正如梁文鋒在採訪中所說，“以後硬核創新會越來越多。當這個社會讓硬核創新的人功成名就，群體性想法就會改變。我們只是還需要一堆事實和一個過程。& rdquo;過去四十年，房地產和網際網路的造富運動都並非由底層創新驅動，而只有當人們看到回報和付出有一定的關係，投機才不會成為中國商業社會最大的價值觀。

“2025年，ai應用會迎來爆發之年。& rdquo;

這是我在去年年底從投資人和fa口中聽到的最多的觀點，甚至有投資人明確表示：2025年只看ai應用。

春節過後，有了deepseek這把火，投資人和企業們對於ai應用的期盼更加強烈了。但興奮之餘，他們眼中也難掩迷茫：知道機會來了，可看不到機會在哪兒？

需要承認的是，面對deepseek帶來的變革，大部分公司都沒來得及在戰略層面做調整，但從行動來看，都在緊急圍繞deepseek開會。也有投資人表示，開工之後接連兩天，都在開關於deepseek的會，已經做了緊急部署。

提到deepseek，很多人的第一印象是高性價比。單就這一點帶來的影響，業界也並未達成一致。

trainiceo孫鄰家認為，“技術過度平權不一定是好事，會失去創新的驅動力。現在看來，2025年是一個從閉源套殼轉為開源套殼的年份，造成的結果可能是出現一堆同質化產品，依然找不到盈利的方法。目前，能做fine-tuning（大模型微調）的公司沒有想像中的那麼多，能持續做並且有創新的就更少，缺數據和人才。& rdquo;

當然，他也承認，模型變小和經濟性提高，對應用肯定是積極影響，但是在應用側，技術不是最大的制約，而是對產業的理解。

其實，現在prompt已經可以滿足很多應用的需求了，似乎沒有做出什麼好產品。如果因為ios閉源，我們有了安卓系統，也沒有出現很多手機品牌。在安卓上長出的軟體應用也沒有殺死ios和其應用。llama的能力也很強大，可以滿足多數應用的需求，離我們期待的也差很遠。

更多的人還是願意看到deepseek給應用端帶來的積極一面，比如有投資人指出，deepseek出來之後，做應用的廠商只需要專注在應用本身的前後端交互體驗，同時再基於場景做打磨就可以了，這省去了很多基礎層面的投入。

合思創始人兼ceo馬春荃指出，ai的發展就像電力的發展一樣，會催生出非常多的應用的廠商，這是一個基礎的能力。deepseek的出現把這種基礎能力的成本變成白菜價。

他進一步解釋稱：很多原來捨不得用ai的地方，現在可以去進行探索和創新，因為當下ai在算力上的消耗成本，相比於客戶價值或者輸出結果相比，已經是九牛一毛了。比如在小票識別領域，我們過去只敢小小批量應用，如今幾乎變成了零成本，我們就可以“肆無忌憚”地應用了。

需要指出的是，究竟是c端應用還是b端應用更能讓vc們青睞時，我從投資人那裡得到了統一的答案——那就是to b應用更具投資性價比。

就連非投資行業的企業內部人員，也認為今年deepseek相關項目在投資市場會比較火爆，因為在他們看來，完全開源的deepseek，會加速很多細分場景模型的誕生。

首先，b端用戶是最具付費能力的，而且所有b端應用都還是沿著原來企業軟體的思路，也就是說每個領域都將有自己的大模型。這是因為不同領域間的資料庫和知識庫存在差異。

但當下的問題是，應用廠商自己不做模型，看不到需求和效果，更重要的，應用創業不同於大模型，投資人們不會給企業很多的時間和資金來試錯。

同樣，現在還無法預測哪些場景會爆發，只能說這些細分應用的出現正在加速。

其次，成本低了，之前只能在實驗室里進行的，可以應用到每個角落。換句話說，當前很多沒有被ai覆蓋的場景，會有更多的廠商用非常低成本的ai去進行改造。

在國科嘉和高級合伙人陸佳清看來，如果有特色應用能夠出現，那可以很快起量。尤其是有應用場景的上市公司，之前打造一個行業應用可能需要幾百台伺服器，現在只需要十台，成本驟降。

再者，ai應用肯定會越來越多，而且會占據市場更多的眼球，因為眼下應用還沒有實現真正大規模的商業化。

對於為何不會選擇c端產品，這是因為投資人們有這樣一個共識——c端應用遲早是大廠們的天下，這在之前是有跡可循的。

除了應用層外，在更底端的硬體層也在發生巨變。比如為了承接住deepseek帶來的流量洪流，此前各地建造的閒置計算中心也被盤活了，相關從業者表示，這些計算中心當下已經開始產生收益。而deepseek本身也因為此前浙江省建造的數據中心獲益。有接近deepseek的投資人表示，自從節前爆火後，浙江將很多空餘的數據中心低價給了deepseek。

據某雲服務廠商的體感來看，上線了deepseek r1版本之後，用戶的註冊量有一個非常明顯的提升，一兩天內註冊量增長了一個數量級，大約是10~20倍的水平。而這些註冊用戶主要分為兩類，一類是個人開發者，他們會去驗證自己的一些創新思路，另一類是企業的開發人員，這類用戶則更多是想通過ai與業務結合做創新應用。

在這個領域，業界也存在著一些非共識。

“deepseek的出現短期內可以顛覆對算力的邏輯，但長期來看，ai和應用的蓬勃發展，必然帶來總體需求的增長，算力還是有價值的。當然，對於國產gpu來講還是偏利空的，因為低製程的晶片可以用了，市場就不需要存在那麼多家了，未來能夠上市的也將只有一兩家。對於其他國產大模型公司也是偏利空的。& rdquo;陸佳清如此判斷。

另一位晶片投資人表示：“這對晶片行業算是絕對利好，核心在於可以用算力比較低的晶片做出很好的訓練效果，這意味著很多晶片廠商能夠獲得相關訂單。同時，越低的訓練成本越有助於人工智慧在應用領域的滲透。& rdquo;

作為專注於智能汽車產業鏈的投資機構，王榮進也會關注deepseek是否會對智駕格局產生影響，會不會引起其他公司快速疊代，衝出一條新的路出來，從而導致相關標的的估值的重估。

關於deepseek帶來的變革和機會，我相信遠遠不止上述討論。更重要的是，deepseek的崛起不僅是一次技術疊代，更帶動了國內目前最稀缺的東西——信心。我不由想起了《人類簡史》關於“講故事”和“相信故事”的觀點，人類社會幾千年來，就是從一次次舊敘事崩塌和新敘事構建螺旋向上發展的，樂觀點看，也許deepseek就是中國經濟在各階層重新凝聚信心的轉折點。

歡迎加入深潮techflow官方社群

telegram訂閱群：https://www.gushiio.com/TechFlowDaily
twitter官方帳號：https://www.gushiio.com/TechFlowPost
twitter英文帳號：https://www.gushiio.com/DeFlow_Intern

原文網址：https://zh.gushiio.com/zixun/606.html