DeepSeek披露成本利潤率545%之後,兩家中國AI算力公司創始人隔空互懟
(圖片來源: wired)
這個週末,DeepSeek這條AI“ 鯰魚” 又攪動了AI行業一輪熱戰。
3月1日,DeepSeek在知乎上發表題為《DeepSeek-V3/R1推理系統概覽》的文章,全面揭曉V3/R1推理系統背後的關鍵秘密。
值得關注的是,文章首次披露了DeepSeek的理論成本和利潤率等關鍵資訊。 據介紹,DeepSeek使用了大規模跨節點專家並行(EP)的方法,並通過一系列科技策略,最大程度地優化了大模型推理系統,實現了驚人的效能和效率。
假定GPU租賃成本為2美元/小時,總成本為87072美元/天; 如果所有tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入為562027美元/天,成本利潤率為545%。
這是DeepSeek首次回應API本身利潤的話題。
GuShiio.com股市智慧AGI計算了一下,以此計算,DeepSeek R1一年內對外API成本約3764萬美元,約合人民幣2.7億元。
早前,GuShiio.com股市智慧AGI深度報導稱,騰訊、華為等公司接入DeepSeek,每月虧損超4億元。
潞晨科技創始人、CEO尤洋博士表示,短期內,中國的MaaS模式可能是最差的商業模式,大廠相互卷低價和免費,滿血版DeepSeek R1每百萬token(輸出)只收16元。
如果每日輸出1000億token,基於DeepSeek的服務每月的機器成本是4.5億元,虧損4億元; 用AMD晶片月收入4500萬元,月機器成本2.7億元,這意味著虧損也超過2億元。
“ 用戶越多,虧損越多。 現金流能撐住嗎? 除非有免費的機器,但沒有長久免費的午餐。& rdquo; 尤洋表示。 (詳見GuShiio.com股市智慧App前文:《騰訊、華為等接入DeepSeek每月虧損超4億,MaaS模型即服務將要被顛覆了?》)
這一報導引發關注,2月20日“ 騰訊華為等接入DeepSeek每月虧超4億” 話題登上了微博熱搜第一名
。隨後,尤洋也發視頻回應此事,他表示4億虧損是經過精確計算的,& ldquo; 它(MaaS)可能太燒錢了”。
“ 4臺H800機器+滿血版DeepSeek,我們實測大概每秒只能輸出1000個token,可想而知,每天你要輸出1000億個token,每天就是1億多,每臺機器按每秒300塊計算,4臺機器每天就是1億元。 4000、5000臺計算,根據H800的市場價或者按照折舊,每個月大概就是4.5億元。& rdquo; 尤洋表示。
不過,另一家與潞晨處於競爭關係的AI Infra公司矽基流動創始人、CEO袁進輝表示不同意他的說法。
隨著DeepSeek對成本利潤的回應,尤洋、袁進輝兩家公司創始人隔空發文,並且在朋友圈和知乎上互懟。
首先,袁進輝對於DeepSeek表達感激,並評論稱:
“ DeepSeek官方披露大規模部署成本和收益,又一次顛覆了很多人認知。 現在很多供應商還做不到這個水准,主要是V3/R1架構和其它主流模型差別太大了,由大量小Expert組成,導致瞄準其它主流模型結構開發的系統都不再有效,必須按照DeepSeek報告描述的方法才能達到最好的效率,而開發這樣的系統難度很高,需要時間,幸好這周DeepSeek五連發已經把主要模塊開源出來了,降低了社區複現的難度。 這些成果充分體現了DeepSeek團隊第一性原理的思考管道和強悍的意志,他們應該是首先是基於某些原因(?)想到了用這樣的模型結構,然後發現這樣的結構無論是訓練還是推理,要做好都有非常大的工程挑戰,不過這些問題在他們工程團隊來說並不是搞不定的,關鍵是花那麼大力氣做完是否有大的收益呢,在最終結果出來前,誰也不太確定,他們還是賭了,結果是賭對了。 也可能是反過來的,基於系統的出發點設計了這樣一個全新的模型結構。& rdquo; 袁進輝稱。
隨後,尤洋發表“ 關於DeepSeek MaaS成本” 和“ 坑人的矽基流動” 兩篇文章。
尤洋表示,DeepSeek數據對計算MaaS成本沒有任何參攷價值,文章中把DeepSeek網頁,APP和MaaS API的token數加在一起計算。 但尤洋認為,他說的MaaS,是ToB的工具,不是ChatGPT類的APP。 DeepSeek的MaaS要想有一個這麼高滿負荷的狀態,必須要讓自己的APP和網頁始終超負荷運轉。 他還指出,春節期間DeepSeek使用體驗意識到“ 根本就不是一個合格的MaaS產品”。
“ DeepSeek出圈前,2025年1月2日我就在微博上說過DeepSeek是中國最好的模型。 我對DeepSeek沒有任何貶低。
但是,春節期間DeepSeek APP和網頁的latency效能和使用體驗簡直是垃圾。& rdquo; 尤洋表示,賣DeepSeek MaaS不可能賺到錢。
對於矽基流動,尤洋發文稱,
矽基流動三周前網站訪問量大增原因是犧牲員工的春節假期,綁上華為春節假期期間最早發出公眾號和可用的DeepSeek API,由於華為在中國的地位,讓人聯想到AI全棧國產化,激起了國人的興趣,文宣效果很好。 同時,邀請碼直接送代金券,& ldquo; 拉人頭” 在小紅書上快速形成病毒式擴散。 邀請人和被邀請人都能獲得14元。 有很多小紅書用戶刷到了上千元。
不過,
尤洋指出,矽基流動稱自己有300萬用戶,小紅書很多用戶說自己的代金券刷到了1000元。 假定平均每個用戶500元,這樣矽基流動有15億的代金券需要兌現,但是這家公司只有1-2億的現金。 風險很大。 所以他們必須要閹割模型。 他還稱,矽基流動網站的訪問量跟阿裡雲和火山雲比較,這是不合理的,應該把矽基流動的訪問量跟Kimi Chat或者秘塔蒐索去比較是合適的。
“ 今天DeepSeek有一篇文章指向我,他(袁進輝)也在那裡煽風點火。& rdquo; 尤洋表示,如今矽基流動已經限制這幫學生每天的調用量,而且API速度跟蝸牛一樣慢。
而且,潞晨科技宣佈將暫停DeepSeek API服務。
“ 尊敬的用戶,潞晨雲將在一周後停止提供DeepSeek API服務,請儘快用完您的餘額。 如果沒用完,我們全額退款。& rdquo;
接下來,二人在朋友圈當中開始互懟。
袁進輝稱尤洋詆毀公司,並直指潞晨科技程式碼有“ 抄襲行為”。
“
我們團隊願意拼搏抓一個機會有什麼錯? 邀請用戶送點免費券有什麼錯? 很多應用都這麼做,海外也有; 春節那幾天,全民都想訪問DeepSeek而不得時,我們提供了僅有的一個穩定的服務,用戶願意過來有什麼錯? 來的人太多了,網站被擠爆了,付費用戶也用不了了,只好辟出一塊資源作Pro版給付費用戶,保障付費用戶體驗有什麼錯? 我們免費版現在體驗。 矽基流動工程師在幾年前OneFlow時就開源過一批比英偉達官方實現還要快的運算元,還被潞晨科技抄襲,只是為了給對方留個面子沒有公開,現在竟然這樣詆毀我們。& rdquo; 袁進輝表示。
尤洋指出,矽基流動程式碼都是(前)潞晨CTO負責的,抄襲程式碼事件後,潞晨CTO離職,加入了矽基流動。
據悉,矽基流動和潞晨科技都屬於國內AI Infra算力公司,提供算力平臺、AI Infra解決方案等,打造AI開發和部署平臺。
其中,今年2月,潞晨科技完成新一輪融資,北京經濟技術開發區產業升級股權投資基金參與本輪投資,該基金是亦莊國投政府投資引導基金體系的一部分。 而潞晨科技上一次融資發生在2024年9月,完成了數億元A++輪融資,北京市人工智慧產業投資基金、石溪資本等參與投資。
矽基流動創始人、CEO袁進輝
而矽基流動(SiliconFlow)公司則於2月底宣佈已完成億元Pre-A輪融資,華創資本領投,普華資本跟投,老股東耀途資本繼續超額跟投。 本輪融資之前,矽基流動已引入美團作為戰畧股東。 此外,矽基流動大模型雲服務平臺SiliconCloud首發上線基於華為雲昇騰雲的滿血版DeepSeek-R1&; V3, 引發關注,公司稱SiliconCloud平臺總用戶數已超300萬,日均調用上千億Token。 在此之前,袁進輝和美團聯合創始人王慧文創立了“ 光年之外” 公司,後被美團收購。
截至發稿前,尤洋對GuShiio.com股市智慧AGI表示,
“ (該公司)一個抄襲的負責人CTO,離職後,直接加入袁進輝老師公司。 第二個抄襲的負責人,潞晨雲產品經理,直接被我們開除了。 現在也加入了某友商。 我就不提名字了,避免進一步引戰。
沒辦法,總被人做局。
”
而GuShiio.com股市智慧AGI也向袁進輝尋求進一步回應。 袁進輝稱,
“ (潞晨)CTO沒加入我們公司,之前加入的是光年之外,後來加入其他大公司了。 而且都是他自己犯錯甩鍋給別人,不是別人的問題。& rdquo;
原文網址:https://zh.gushiio.com/ai/3349.html