“我勸過梁文鋒很多次,deepseek 要融資”

2025年,ai應用會迎來爆發之年。

作者:劉雪楠,投中網

“我勸過梁文鋒很多次,deepseek 要融資”插图

爆火的deepseek,足以載入史冊。很多年後人們回想起這一刻,結論或許是從2022年底openai發布chagpt,中國ai發展的主流敘事始終是“追趕”,而deepseek橫空出世,將“追趕“變成了“創新”和“普及”,甚至是“重塑”和“超越”。

但vc們顯然是失意的,因為包括“大模型六小龍”在內,他們支持的大模型創業項目,自始沒有一個達到deepseek這樣的全球熱度,幾乎與deepseek同時發布的,kimi全新強化學習模型k1.5,雖然是全球繼openai之後首個多模態類o1模型,在諸多層面能力接近o1甚至是超越,但沒有濺起多大水花,同樣淹沒在了deepseek狂熱的輿論中。

一切或許要從deepseek創始人梁文鋒登上新聞聯播,成為總理的座上賓開始。他在這次會上說了什麼,可能不是最重要的,輿論關心的是,為什麼一個留著長劉海的80後,會突然得到高層的關注?再看看朋友圈,哦?做量化基金的。更好奇了。

作為長期跟蹤ai產業的一級市場觀察者,輿論發酵速度低於我的預期,程度卻遠超我的想像。1月20日,周日晚間梁文鋒登上新聞聯播,發酵了足足一周,顛覆全世界的“deepseek r1 550萬結雅訓練成本”,只讓周五英偉達的股價下跌3.12%,轉過頭來的下周一,卻讓a股創業板收穫了根-2.73%的大陰線。當時我的評價是,deepseek打了英偉達們一個嘴巴,轉頭卻更狠地踹了a股一腳。

打臉來得很快,1月27日當天,英偉達低開低走下跌接近17%,全世界的算力一片哀嚎,高喊“狼來了”,deepseek就是那條狼。當然了,我個人的榮辱不算什麼,打臉也是經常的事。但中國vc卻幾乎成了ai算力之外,最大的“受害者”,輿論不吝給予梁文鋒和他的理想主義最大程度的讚揚,同時也施加給中國vc極致的羞辱和討伐,比如小紅書有篇帖子,標題為“deepseek再次證明,中國vc就是個笑話”。更不幸的是,點讚還過千了。

“我勸過梁文鋒很多次,deepseek 要融資”插图1

但我還是要旗幟鮮明地說一句,道德層面的討伐很低級,這個階段討論“vc為什麼沒投到deepseek”,除了情緒上的宣洩,也沒太大意義,沒投到就是沒投到,任何客觀或主觀的原因都像是辯解。進一步的反思雖然非常有必要,但也不是立刻,縱觀國內一級市場,從lp到gp,再到募投管退的各個環節,大量“頑疾”很難短時間根除,很多也根本不是vc/pe們能決定的。

我認為亟待討論的是現在和未來,至少包括三個問題:現在deepseek能不能投到以及估值多少?deepseek對此前已經投資的各類ai項目有什麼影響?deepseek引發的ai產業變革,對vc下一步在ai的資本部署,有哪些積極指引?

一、deepseek融資?梁文鋒“打太極”

關於deepseek估值多少以及能不能投到,這兩天已經有不少消息流出了。就在昨天晚間,有消息稱阿里將以100億美金估值,投資10億美金占股10%。對此阿里副總裁顏喬很快通過朋友圈闢謠稱,“外界流傳阿里投資deepseek的信息是假消息”。不過,一位可能接近此次交易的投資人向投中網表示,“現在比較敏感,他們也不方便說,要再等等”,因此這筆被否認的交易,不排除還可能存在一些變數。

而在此之前,就有某ai投資人對投中網表示,deepseek正與投資人接觸,他透露的估值是80億美金,與前述“阿里給出100億美金估值”的“假消息”有差距,而不管是80億美金,還是100億美金,deepseek的估值目前已遠超“大模型六小龍”中最高的minimax—— 40億美金。

據投中網了解,這幾天有不少投資人,都直接或間接找到梁文鋒確認是否正式啟動融資,估值也大致圍繞上述範圍,但梁文鋒並未給出承認或否認的正面回應,而是以“打太極”為主。也有不少投資人找到deepseek負責ir的相關人士詢問是否正在進行融資,截至昨天都得到了否認的結果。

另外還有一層信息是,deepseek內部也有人“勸過梁文鋒很多次,deepseek要不要融資”。這至少意味著兩點,一是對於是否進行融資,deepseek內部意見也許並不統一,但決定權一定在梁文鋒,只有他握著開啟寶藏的鑰匙;二是梁文鋒近期很可能與一些投資人或產業資本有過接觸,但維持在一個極小的圈子。

比如多次對投資大模型嗤之以鼻的朱總,就肯定不在這個圈子中,即使deepseek讓他轉變了對大模型的態度,表示“我肯定會投啊”,但投中網向他詢問是否聽說deepseek融資的消息時,得到的回覆是“沒有”。但朱總畢竟是朱總,對vc應不應該參與deepseek融資的重點拿捏得很準,“這個價格已經不太重要了,關鍵是參與在這裡面”。

扯遠了,總之現在vc對於deepseek融資這件事,預期是很高的,多位投資人從c端流量承接、激增的帶寬和算力成本、未來繼續scale up,以及最重要的,留住人才以保持持續的創新能力等角度,向投中網敘述了deepseek融資的必要性。

當然了,還是那句話,鑰匙只在梁文鋒,以及可以決定deepseek能否走向更大敘事可能的人的手中。接下來的,就是時間問題了。但從我個人出發,更樂於看到deepseek能否再堅持一段時間,一方面時間越長,期間博弈一定更加精彩;另一方面如某投資人在朋友圈中所說,“deepseek若能保持private company to build public good的純粹,這種優美是稀缺的。& rdquo;

二、“無論如何要跪進去一些份額”

deepseek在春節前後的出圈,令大模型投資人心情複雜。驚喜在於,中國大模型企業能夠這麼快趕上世界水平,恐慌則在於,整個ai投資的邏輯可能會發生巨大的變化。

至少在國內,deepseek已經贏了這場戰爭。它正在進行的一輪融資估值已經達到80億美金,是行業里估值最高的一家,這都得搶破頭或只能定向融。& rdquo;一位ai投資人告訴我。

deepseek此前並未開放融資,初期資金由幻方量化支持。按照梁文鋒在訪談中的說法,他也嘗試過找資方,但礙於自己專注於研究的想法和vc更多考慮商業化的訴求不相符,於是斷了念想。與之形成鮮明對比的是,爆火之後的deepseek開始被投資人包圍。

鋒芒已露,縱然想要善刀而藏也是難事,在前述投資人看來,如今融資也是形勢所迫,不得已而為之。& ldquo;現在dau飆漲到2000萬,流量來得如此迅猛,已經明顯承接不住。如果deepseek只是開發模型,不做應用,那沒問題,但做了應用,現在每一天都要花幾百甚至上千萬出去,必須考慮伺服器、網絡資源之類的問題。另外,已經跑通了單點,現在要去scale up,scale up也是要花錢的。& rdquo;

但這一消息並未得到當事方的承認。面對最近前來問詢的投資人,deepseek融資負責人給出的說法仍然是,“沒有融資打算”。昨晚“阿里計劃以100億美金的估值,投資10億美金認購deepseek10%股權”的消息也被阿里副總裁明確否認,而這不妨礙阿里巴巴美股盤前一度漲超6%。

一筆投得出幾十億的國資和大廠,被認為是最有可能入局deepseek融資局的候選人。一些有意思的細節是,幻方杭州總部所在的匯金國際大廈,與浙江省金控在同個寫字樓不同座,目前已經擠滿了記者和投資人,deepseek北京辦公室所在的融科大廈,又跟百度投資在一座樓上。

一位省級國資的投資人對投中網表示,最近他們機構“從上到下”,都在跟deepseek方面接觸,無論如何希望“跪一部分份額”進去,但deepseek口咬得很死,堅稱目前並沒有開放融資窗口。

事實上,對ai圈子裡的人來說,deepseek不算神秘,疫情期間囤了一萬張a100的江湖傳說流傳甚廣。我從投資人處了解到的信息是,2023年初,deepseek曾經聊過一圈大模型公司和投資機構,也包括小紅書的創始人毛文超。不過在今年1月,deepseek和小紅書達成合作,目前deepseek入駐的官方社交媒體,也只有小紅書、x、微信公眾號。顯然,梁文鋒對小紅書是有些偏愛的。

跟梁文鋒的說法一樣,聊完以後,梁文鋒和vc們發現大家的目標並不一致。& ldquo;vc都是幫lp管錢,都得賺錢,所以就談不到一塊去。& rdquo;2023年7月,梁文鋒成立杭州深度求索(deepseek)人工智慧基礎技術研究有限公司,專注於通用人工智慧與大模型研發。巧的是,字節開始投入ai研發也是在那個時間點。

另外的細節是,2022年左右,量化基金被政策持續打壓,幻方管理規模也持續縮減。而梁文鋒在創立deepseek前除了接觸過vc外,因為手握大量的gpu算力集群,再加上樑文鋒自己的錢,曾想通過投資入股、找雲廠商合作等方式,將手中富裕的算力“用出去”,還為此招了兩個人專門做戰投,看了大量包括低空等在內的科技項目,但幻方的結論是,“外面能做的,自己也能做”,多數項目“意思不大”,最終“一個也沒投”。後來基於梁文鋒技術理想主義的情懷,deepseek應運而生。

大模型市場的變化瞬息萬變,deepseek很快將成為攪動市場的鲶魚。& ldquo;我去看各種ai項目的時候,基本上都會問對方在用哪些基座,覺得哪些模型比較好,到2024年的時候,大家的普遍反饋已經是通義、豆包和deepseek。& rdquo;一家投資機構的合伙人eric(化名)告訴我。

deepseek在大眾層面的普及來源於兩個模型。1月13日,deepseek推出app版本,使用v3大模型,這是一個全開源moe(混合專家)模型。deepseek報告稱其v3模型的訓練成本僅為600萬美金,只有llama 3的1%。1月20日,deepseek發布開源大模型r1,又以極低訓練成本達到與openai最新o1模型相近的性能。一天後,deepseek登頂蘋果中美地區應用商店免費下載排行榜。

“應該沒有人能預想到deepseek會這麼火。發布v3的時候,業內都注意到了,但因為當時app沒上線,所以還沒有引爆c端。當應用發布之後,普通人都覺得產品效果好,deepseek便開始出現在街談巷議之中。自然流量和買來的流量,這時候差異一下就顯出來了。& rdquo;一家機構的合伙人jared(化名)說。

任何產品的火爆離不開天時地利人和,時點很重要。在eric看來,當下ai的上升曲線已經變緩,預訓練的數據差不多用光了,大語言模型能力不再容易上升,只能轉換思路轉向以openai的o1和deepseek的r1為代表的推理模型。& ldquo;這個時候,是選擇繼續砸大錢去搏一個上限,還是不追求那5%的進步而是把成本降到原來的1/10?deepseek代表的降成本路線恰恰出現在一個合適的時間點上。& rdquo;

三、“六小龍”不走差異化之路將很難再融到錢

“國內大模型訓練的綜合成本(數據,人工,電力和算力)比美國低,而deepseek因為其出色的工程能力,更是把成本控制到極致。在未來兩個季度里,deepseek會成為行業基準線,降成本是大勢所趨。如果為了提高5%的上限,再花10倍的錢,從資本和商業角度考量,這是不值當的。& rdquo;jared認為。

大模型過去燒錢兇猛,研發成本降低,首先動搖的是對這些企業的估值邏輯。

eric認為,deepseek之所以在海外引發這麼高的恐慌情緒,正是因為那些大公司的估值要重新評價了。“過去大家相信,大模型本質上是資本的競爭,正如我們說2023年5月之前如果沒拿到1億美金,在國內就別搞大模型了。但當大家發現不需要那麼多錢,大模型公司的估值恐怕很難撐得住。長期來看,估值是建立在你創造的價值基礎上,短期來看取決於大家認為你的壁壘有多高。& rdquo;

王榮進則認為,deepseek出現後會不會對現有大模型公司估值產生影響,現在還不好說,但他們極低的成本對業內還是帶來衝擊。如果大模型企業能通過其他方式去創新降低訓練或推理成本,估值受到影響或許比較有限。& ldquo;不排除國內的公司通過其他方式去創新達到類似的效果,關於這一點也值得期待。& rdquo;

jared的態度比較悲觀。他相信,如果“六小龍”不走差異化之路,將很難再融到錢。大廠有資本加持,可以繼續戰鬥,但創業公司如果在單一項目上卷不到第一,基本上沒有太大意義。& ldquo;當然,只要有差異化,並且不燒錢,苟活著也是個出路。& rdquo;

事實上,“六小龍”已經分化出不同的路徑。有的公司仍在燒錢訓練大模型,比如我了解到某公司去年收入3個億左右,但成本卻高達20多億。有的公司已經放棄,比如零一萬物已與阿里雲成立“產業大模型聯合實驗室”,不再追求訓練超級大模型,但會繼續訓練參數適中的更快、更便宜的模型,基於後者打造可以賺錢的應用。

“當預訓練結果已經不如開源模型時,每個公司都不應該執著於預訓練。& rdquo;在《晚點》訪談中,李開復如是說。也有的公司投入更多精力在多模態上,比如minimax。還有的公司轉向紮根垂直行業,比如百川的重點已經落在了做醫療大模型上。jared認為,最終這些大模型企業估值是否重構還是取決於商業化的成果,deepseek如果融資也會面臨一樣的商業化問題。

四、關於deepseek的共識和分歧

deepseek已經被一些人視為“國運”的象徵,但能否獨占鰲頭在投資人眼中仍有分歧。

jared相信,大廠很難做出deepseek那樣的創新。原因在於,大廠資源過剩,反而就沒有人會想著如何極致地優化成本。同時內部賽馬嚴重,更多是在卷人,而不是卷事情。kpi通常被簡化為“實現多少dau”這一通過買流量就能實現的目標,也會導致大家很難扎紮實實做技術創新。而做對沖基金出身的人對資源和成本看得很重,總是在想著怎麼工程化創新降低成本,這跟大廠的基因和技能點也不一樣。

但eric認為,在那些明星創業公司里deepseek會長期居於第一位,但還很難說deepseek比阿里和字節的大模型厲害,從所採用的技術範式上來看,理論上openai的o1的範式上限要高於deepseek的r1。& ldquo;到底應該省錢,還是追求高上限,這是一個選擇問題。放在國內來講,大家的能力都很強,只不過側重點不一樣,豆包和通義都做了多模態模型,deepseek做得更聚焦,只做語言模型,它最強大的地方還是在於省錢。& rdquo;

春節期間,軒元資本創始合伙人王榮進一直在找資料研究deepseek的底層邏輯。在他看來,deepseek在應用、工程、架構等多個方面做了很多創新。至於市場討論的借鑑方面,他覺得這也沒什麼,openai的transformer源於google,蘋果的ios部分參考了富士施樂,微軟的microsoft的gui部分參考的是富士施樂的xerox alto,大家都是站在巨人的肩膀上更進一步。& rdquo;

外媒的描述更有意思。有的媒體將openai和deepseek之間的不同路徑比作17世紀英國內戰中“錯誤但浪漫”的保皇黨與“正確但令人反感”的圓顱黨之間的衝突。人工智慧保皇黨不惜一切代價追求agi,而人工智慧圓顱黨專注於更實際的目標,儘可能高效地解決特定問題。海外有關大模型融資的最新消息是,ilya sutskever創立的safe superintelligenc正以200億美金估值洽談融資——仍然是一個昂貴的價格。

瀰漫在行業上空的還是一團迷霧。& ldquo;連著幾年,大模型在年初都有讓人震撼的新進展,而且往往年初和後面發生的事情脫節,所以現在誰也不能預測年底到底會發生什麼。& rdquo;jared說。

eric認為,r1代表的這種後訓練模型模式剛剛開始,deepseek只是在中間提出了一個分叉,到底會跑成什麼樣還不知道,但毫無疑問創業的需求會急劇加大。在他看來,deepseek更重要的意義在於帶來一種全新的價值觀。& ldquo;他們的目標不是說賺多少錢,而是能不能做出有價值的創新,這個價值觀值得中國企業尤其是大公司思考。& rdquo;

正如梁文鋒在採訪中所說,“以後硬核創新會越來越多。當這個社會讓硬核創新的人功成名就,群體性想法就會改變。我們只是還需要一堆事實和一個過程。& rdquo;過去四十年,房地產和網際網路的造富運動都並非由底層創新驅動,而只有當人們看到回報和付出有一定的關係,投機才不會成為中國商業社會最大的價值觀。

“2025年,ai應用會迎來爆發之年。& rdquo;

這是我在去年年底從投資人和fa口中聽到的最多的觀點,甚至有投資人明確表示:2025年只看ai應用。

春節過後,有了deepseek這把火,投資人和企業們對於ai應用的期盼更加強烈了。但興奮之餘,他們眼中也難掩迷茫:知道機會來了,可看不到機會在哪兒?

需要承認的是,面對deepseek帶來的變革,大部分公司都沒來得及在戰略層面做調整,但從行動來看,都在緊急圍繞deepseek開會。也有投資人表示,開工之後接連兩天,都在開關於deepseek的會,已經做了緊急部署。

提到deepseek,很多人的第一印象是高性價比。單就這一點帶來的影響,業界也並未達成一致。

trainiceo孫鄰家認為,“技術過度平權不一定是好事,會失去創新的驅動力。現在看來,2025年是一個從閉源套殼轉為開源套殼的年份,造成的結果可能是出現一堆同質化產品,依然找不到盈利的方法。目前,能做fine-tuning(大模型微調)的公司沒有想像中的那麼多,能持續做並且有創新的就更少,缺數據和人才。& rdquo;

當然,他也承認,模型變小和經濟性提高,對應用肯定是積極影響,但是在應用側,技術不是最大的制約,而是對產業的理解。

其實,現在prompt已經可以滿足很多應用的需求了,似乎沒有做出什麼好產品。如果因為ios閉源,我們有了安卓系統,也沒有出現很多手機品牌。在安卓上長出的軟體應用也沒有殺死ios和其應用。llama的能力也很強大,可以滿足多數應用的需求,離我們期待的也差很遠。

更多的人還是願意看到deepseek給應用端帶來的積極一面,比如有投資人指出,deepseek出來之後,做應用的廠商只需要專注在應用本身的前後端交互體驗,同時再基於場景做打磨就可以了,這省去了很多基礎層面的投入。

合思創始人兼ceo馬春荃指出,ai的發展就像電力的發展一樣,會催生出非常多的應用的廠商,這是一個基礎的能力。deepseek的出現把這種基礎能力的成本變成白菜價。

他進一步解釋稱:很多原來捨不得用ai的地方,現在可以去進行探索和創新,因為當下ai在算力上的消耗成本,相比於客戶價值或者輸出結果相比,已經是九牛一毛了。比如在小票識別領域,我們過去只敢小小批量應用,如今幾乎變成了零成本,我們就可以“肆無忌憚”地應用了。

需要指出的是,究竟是c端應用還是b端應用更能讓vc們青睞時,我從投資人那裡得到了統一的答案——那就是to b應用更具投資性價比。

就連非投資行業的企業內部人員,也認為今年deepseek相關項目在投資市場會比較火爆,因為在他們看來,完全開源的deepseek,會加速很多細分場景模型的誕生。

首先,b端用戶是最具付費能力的,而且所有b端應用都還是沿著原來企業軟體的思路,也就是說每個領域都將有自己的大模型。這是因為不同領域間的資料庫和知識庫存在差異。

但當下的問題是,應用廠商自己不做模型,看不到需求和效果,更重要的,應用創業不同於大模型,投資人們不會給企業很多的時間和資金來試錯。

同樣,現在還無法預測哪些場景會爆發,只能說這些細分應用的出現正在加速。

其次,成本低了,之前只能在實驗室里進行的,可以應用到每個角落。換句話說,當前很多沒有被ai覆蓋的場景,會有更多的廠商用非常低成本的ai去進行改造。

在國科嘉和高級合伙人陸佳清看來,如果有特色應用能夠出現,那可以很快起量。尤其是有應用場景的上市公司,之前打造一個行業應用可能需要幾百台伺服器,現在只需要十台,成本驟降。

再者,ai應用肯定會越來越多,而且會占據市場更多的眼球,因為眼下應用還沒有實現真正大規模的商業化。

對於為何不會選擇c端產品,這是因為投資人們有這樣一個共識——c端應用遲早是大廠們的天下,這在之前是有跡可循的。

除了應用層外,在更底端的硬體層也在發生巨變。比如為了承接住deepseek帶來的流量洪流,此前各地建造的閒置計算中心也被盤活了,相關從業者表示,這些計算中心當下已經開始產生收益。而deepseek本身也因為此前浙江省建造的數據中心獲益。有接近deepseek的投資人表示,自從節前爆火後,浙江將很多空餘的數據中心低價給了deepseek。

據某雲服務廠商的體感來看,上線了deepseek r1版本之後,用戶的註冊量有一個非常明顯的提升,一兩天內註冊量增長了一個數量級,大約是10~20倍的水平。而這些註冊用戶主要分為兩類,一類是個人開發者,他們會去驗證自己的一些創新思路,另一類是企業的開發人員,這類用戶則更多是想通過ai與業務結合做創新應用。

在這個領域,業界也存在著一些非共識。

“deepseek的出現短期內可以顛覆對算力的邏輯,但長期來看,ai和應用的蓬勃發展,必然帶來總體需求的增長,算力還是有價值的。當然,對於國產gpu來講還是偏利空的,因為低製程的晶片可以用了,市場就不需要存在那麼多家了,未來能夠上市的也將只有一兩家。對於其他國產大模型公司也是偏利空的。& rdquo;陸佳清如此判斷。

另一位晶片投資人表示:“這對晶片行業算是絕對利好,核心在於可以用算力比較低的晶片做出很好的訓練效果,這意味著很多晶片廠商能夠獲得相關訂單。同時,越低的訓練成本越有助於人工智慧在應用領域的滲透。& rdquo;

作為專注於智能汽車產業鏈的投資機構,王榮進也會關注deepseek是否會對智駕格局產生影響,會不會引起其他公司快速疊代,衝出一條新的路出來,從而導致相關標的的估值的重估。

關於deepseek帶來的變革和機會,我相信遠遠不止上述討論。更重要的是,deepseek的崛起不僅是一次技術疊代,更帶動了國內目前最稀缺的東西——信心。我不由想起了《人類簡史》關於“講故事”和“相信故事”的觀點,人類社會幾千年來,就是從一次次舊敘事崩塌和新敘事構建螺旋向上發展的,樂觀點看,也許deepseek就是中國經濟在各階層重新凝聚信心的轉折點。

歡迎加入深潮techflow官方社群

telegram訂閱群:https://www.gushiio.com/TechFlowDaily
twitter官方帳號:https://www.gushiio.com/TechFlowPost
twitter英文帳號:https://www.gushiio.com/DeFlow_Intern

原文網址:https://zh.gushiio.com/zixun/606.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *