為什麼bat沒能做出deepseek
文|藍媒匯,作者|葉二,編輯|魏曉
一夜之間,deepseek搶走了幾乎所有國產大模型的風頭。
過去一年,無論是在c端出圈的kimi,還是後在居上的豆包,無論是用戶日活早早突破2億的文心一言,還是登頂全球開源第一的通義千問,與deepseek給全球科技圈帶來的震動相比,都遜色不少。
這並非是一眾國產大模型不給力,而實在是deepseek太優秀了。
以前國內大廠一直討論的是,距離openai到底有多少年差距,但在deepseek這裡,卻是另一番景象。市場熱議的是deepseek是否已經干翻了openai,其所代表的開源路線,已經在倒逼openai ceo山姆·奧爾特曼進行反思:“我個人認為,在這個問題上我們站在歷史的錯誤一邊。現在需要想出一個不同的開源策略。& rdquo;
deepseek的橫空出世,其帶來的影響不僅是在行業內,同樣也更在c端市場。
數據顯示,僅僅上線20天,deepseek的日活就突破了2000萬大關,成為全球增速最快的ai應用。與之相比,chatgpt突破1500萬大關花了244天,而deepseek僅用了18天。上線20天後的deepseek日活已達2215萬,是chatgpt日活用戶的41.6%,並遠超豆包日活用戶的1695萬。
這是一場極其誇張的ai風暴,並且跟以往截然不同的是,這是一家真正由中國創業公司主導引發的ai風暴。
問題在於,為什麼是deepseek?
要知道,過去兩年國內主流的網際網路大廠都在大模型賽道上投入重兵,也都跑出了不少產品,市場也普遍抱有期待,希望其中有誰能早上追上openai,與矽谷ai一較高下。
但最終破局的,卻是deepseek,大廠沒做到的,它反而實現了。
深耕已久
本質上deepseek當下的爆火,是一種厚積之下的爆發。
雖說此次deepseek是一鳴驚人,但其團隊早就在ai領域布局多年,時間線上甚至比大廠還早,布局寬度以及深度,也絲毫不比大廠差多少。
公開數據顯示,deepseek,由知名私募巨頭幻方量化孕育而生,創始人為梁文鋒。
事實上,早在大學期間,即便在當時,人工智慧還是一個空有理論並無實質的概念,但梁文鋒無比篤信,“人工智慧一定會改變世界”。
這也成為了其創業以來的終極願景。
2015年梁文鋒創辦幻方,這是是國內最早使用人工智慧進行量化交易的公司,2016年第一份由深度學習生成的交易倉位上線執行,2017 年全面應用深度學習技術進行交易。
到了2018年,幻方官網將“把ai確定為公司的主要發展方向”寫入公司大事,再一年,幻方乾脆改變了組織架構,成立了幻方ai,對外自我居間時總說自己是一家以大規模深度學習基礎研究與應用為核心的人工智慧公司。
自2019年至2021年間,幻方相繼自主研發了“螢火一號”與“螢火二號”ai集群,其中“螢火二號”投資達到10億元,極大提升算力支持。同時,幻方也積極招募了一批算法科學家。而創始人梁文鋒本人,則每天也都在寫代碼、跑代碼。
技術上,一直在穩步儲備,基建上,更是沒有落下。
可能很少有人能預料到,2023年當chatgpt橫空出世時,市場突然發現在國內,擁有高性能gpu晶片最多的不是人工智慧公司,而是梁文鋒旗下的幻方量化。
彼時根據國盛證券研報,在雲算力端,當時除了幾家網際網路公司(商湯、百度、騰訊、字節、阿里),就只有幻方有超過1萬張a100晶片儲備。
足見,幻方對ai的投入,對比大廠,絲毫不落下風。
反套路
還有就是,以梁文鋒為代表的deepseek創業團隊的銳氣。
網際網路大廠的ai戰略往往依附於現有業務體系。騰訊的ai需服務於社交與遊戲生態,阿里的ai需嵌入電商和雲計算場景。這種業務協同邏輯,固然能快速商業化,卻也框定了技術演進的路徑——資源投入越多,越傾向於優化既有模式,而非另闢蹊徑。
而背靠幻方的deepseek,既有強大的財力支持,又有身為創業者敢於“從零開始”,不怕試錯的勇氣。這讓deepseek只需要沿著創新的信念,一路蹚過去。
對於創新,梁文鋒的態度是非常堅決的——“過去很多年,中國公司習慣了別人做技術創新,我們拿過來做應用變現,但這並非是一種理所當然。這一波浪潮里,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。& rdquo;
“我們看到的是中國ai不可能永遠處在跟隨的位置。我們經常說中國ai和美國有一兩年差距,但真實的gap是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。& rdquo;
而如何實現創新,則是拋棄慣性的反套路。
最直接的體現,就是在團隊組成上。
國內大廠在進入大模型賽道上,通常傾向於去海外挖人,引入技術大牛,快速拉起一個團隊,然後大干快上。而deepseek團隊組多由本土一些top高校的應屆畢業生組成,不看經驗資歷,選人的標準一直都是熱愛和好奇心。
同時在工作機制上,“我們一般不前置分工,而是自然分工。每個人有自己獨特的成長經歷,都是自帶想法的,不需要push他。探索過程中,他遇到問題,自己就會拉人討論。不過當一個idea顯示出潛力,我們也會自上而下地去調配資源。& rdquo;
“如果有想法,每個人隨時可以調用訓練集群的卡無需審批。同時因為不存在層級和跨部門,也可以靈活調用所有人,只要對方也有興趣。& rdquo;
換句話說,大廠的組織架構,本質是一台精密運轉的“效率機器”。但顛覆性創新的誕生,需要的恰恰是反效率的“失控”。
而deepseek正做到了這一點。
ai藍媒匯也就為什麼大廠沒有做出deepseek的問題,向deepseek提問,後者表示,本質上是組織慣性、商業化壓力與技術路徑共同作用的結果,並稱:
這場由開源模型引發的技術革命,正在倒逼大廠重新思考創新邏輯。若無法跳出既有框架,其技術話語權或將進一步削弱。
原文網址:https://zh.gushiio.com/ai/362.html