國產大模型發展史：大模型競爭進入“後暴力計算時代”

後浪兇猛進化，前浪披荊斬棘。

作者：關鍵幀

國產大模型發展史：大模型競爭進入“後暴力計算時代”插图1

圖片來源：由無界AI生成

AI競技場正靜靜見證著一場深刻的科技權力騰挪。

這場由DeepSeek引發的變革仍未見平息，大模型競爭進入&ldquo；後暴力計算時代&rdquo；，效率的重要性躍然紙上，而AI權力也面臨重構， OpenAI“ 一家獨大&rdquo；的局面正不斷受到衝擊。

後浪兇猛進化，前浪披荊斬棘，& ldquo; 城頭變幻大王旗&rdquo；贏家尚未有定論，如何既通過開源獲取生態的加持，又利用閉源實現商業變現，才是決勝的關鍵。

01、中國AI項目乘政策風&ldquo；井噴&rdquo；

國產AI的發展在不聲不響間悄然醞釀。 2023年被業內人士視為人工智慧發展的分水嶺。

人工智慧科學家李飛飛曾說：& ldquo; 在歷史上，2023年有望因科技的深刻變化和公眾覺醒而被人們銘記。& rdquo;

而在此之前，關於人工智慧的科技探索和創新早已不勝枚舉。

1956年約翰&middot；麥卡錫在達特茅斯會議上首次提出&ldquo；人工智慧&rdquo；（Artificial Intelligence）概念，AI作為一門學科正式誕生。

但到了1973年，由於AI研究遭遇瓶頸，對AI的資金投入大幅縮水，發展進入&ldquo；寒冬&rdquo；。

1986年，直到&ldquo； AI教父&rdquo；傑佛瑞&middot；辛頓（Geoffrey Hinton）提出了反向傳播（Backpropagation）算灋，神經網路的復興讓AI發展再迎曙光，再到2017年Google提出基於自注意力機制（Self-Attention），取代RNN/LSTM，成為後續大語言模型（LLM）的覈心架構&hellip；& hellip;

回望國內的AI發展歷程，2023年同樣是&ldquo；國產AI時代開啟元年&rdquo；。

據天眼查，僅2023年上半年與大模型直接相關的融資事件超20起，國內已發佈的各類大模型數量超過100個，而到了2024年7月時完成備案並上線的生成式AI大模型數量接近200個。

直到今天，有機會沖進決賽圈的依然只有十幾家。諮詢機構弗若斯特沙利文指出，我們現時在通用基礎大模型領域的競爭者已縮減至20餘家，主要由互聯網企業、云計算巨頭及人工智慧創業公司主導。

大家都是這場沒有硝烟的&ldquo；戰爭&rdquo；的親歷者，站在2025年的開年回望，或許是經歷了2024年&ldquo；百模大戰&rdquo；的大浪淘沙，DeepSeek才得以在2025年開年在全球科技行業投擲下&ldquo；驚雷&rdquo；，推動國產AI實現了&quot；關鍵一躍&quot；，站穩腳跟。

擁有持續創新能力的企業逐漸佔據市場主導，從圖文轉視頻到多語言廣告生成，人工智慧的應用範圍正在迅速拓展。

與此同時，大模型和智慧體科技也進入了加速發展階段。無論是C端的用戶體驗優化，還是B端的企業解決方案，智慧體和大模型正在重新定義科技與社會的連接管道。

決賽圈裏目前有三股力量：一是阿裡巴巴、位元組跳動代表的互聯網大廠、雲服務商，介入大模型；二是科大訊飛代表的人工智慧國家隊，以G/B/C聯動的管道，既做解決方案又做硬體產品；三是智譜、DeepSeek等AI創業公司，少數還在堅持基礎模型創新。

產業鏈上下游處境分化，模型廠商發展路徑分野。即便&ldquo； AI六小虎&rdquo；，也面臨道路分化。例如，百川智慧已轉向醫療等行業大模型；零一萬物將超級大模型訓練交給阿裡；月之暗面和MiniMax專注做C端應用和產品。

業內人士普遍認為，與產業鏈上下游相比，處於中游的模型廠商普遍面臨盈利困境。 2025年，大模型決賽圈的選手，還能在基礎大模型層創新的企業，會進一步减少。

02、從&ldquo；燒錢信仰&rdquo；到&ldquo；效率革命&rdquo；

如果說&ldquo；成本、 AI Agent、多模態&rdquo；是當下AI產業的三個關鍵字，代表著2024年大模型的進化方向，那麼它們或許也代表著大模型邁向產業落地的關鍵節點。

首先，成本無疑是决定企業生死的關鍵，訓練和部署大規模AI模型對計算資源的龐大需求不容忽視，這也使得企業必須背負高昂的計算成本和運維成本。

DeepSeek-R1也正是抓了企業在效率和成本控制上的痛點，實現了在相對較低的算力投入下，可媲美甚至超越頭部模型的效能表現。

傳統人工智慧發展模式往往依賴於&ldquo；規模至上&rdquo；的邏輯，追求超大規模模型和超大規模算力集羣。 DeepSeek R1的輕量化模型和開源策略，降低了人工智慧應用的門檻，促進了中端算力設施和分佈式資料中心的普及。

產業鏈上游的英偉達，因DeepSeek的出現開始面臨一定需求結構調整的壓力。

ASIC晶片廠商則迎來了新的發展機遇。由於ASIC晶片能够針對特定人工智慧應用進行硬體加速，在能效比和成本控制上具有明顯優勢，更適應分佈式算力發展的趨勢。

對於算力服務端來說，區域性資料中心憑藉低時延和貼近應用場景的優勢，開始承接製造業智慧質檢、金融風控等對延遲敏感的應用需求。

AWS、阿裡雲等云計算巨頭調整部分大型資料中心的建設策略，加大在邊緣計算和分佈式算力佈局方面的投入。

而應用端則將受益於算力成本的下降，驅動人工智慧在製造業、金融、醫療等領域的滲透加速。

在程式碼託管平臺GitHub上，已湧現出大量基於DeepSeek模型的集成應用案例（awesome deepseek integration），形成&ldquo；需求牽引供給&rdquo；的正向迴圈，實現&ldquo；算力+行業&rdquo；的雙向賦能。

人工智慧科技將加速滲透到各行各業，成為推動產業升級和經濟發展的重要引擎。

但值得關注的是，DeepSeek R1的科技突破，在降低人工智慧應用門檻的同時，也可能引發&ldquo；傑文斯悖論&rdquo；。

傑文斯悖論由19世紀經濟學家William Stanley Jevons提出，他發現，隨著煤炭使用效率的提高，煤炭的消耗總量反而新增。這一悖論揭示了一個深刻的經濟規律：效率的提升並不必然導致資源消耗的减少，反而可能因為成本降低和應用範圍擴大，刺激需求增長，最終導致資源消耗總量新增。

微軟CEO薩提亞&middot；納德拉引用傑文斯悖論來解釋DeepSeek R1可能帶來的影響，可謂一針見血。

納德拉認為，更實惠、更易於訪問的人工智慧科技，將通過更快的普及和更廣泛的應用，導致需求的激增。
隨著人工智慧科技的門檻降低，過去由於成本限制而無法應用人工智慧的領域，例如中小企業、邊緣計算場景等，將湧現出大量新的應用需求，從而導致算力調用密度指數級上升。

新興應用場景的爆發，也將加速算力需求的裂變。智慧駕駛、具身機器人等前沿領域對實时算力的需求極為龐大，遠超DeepSeek科技優化的速度。即使單任務效率提升數倍，百萬級智慧終端的併發需求，仍將形成巨大的算力吞噬黑洞。

03、& ldquo; 開源&rdquo；與&ldquo；閉源&rdquo；的協同

隨著開源大模型DeepSeek的&ldquo；爆火&rdquo；，& ldquo; 開源&rdquo；和&ldquo；免費&rdquo；等關鍵字頻現。

如果說，在DeepSeek之前，國內大模型企業關於&ldquo；開源&rdquo；和&ldquo；閉源&rdquo；的路徑仍多有分歧，現在&ldquo；開源&rdquo；、& ldquo; 開放生態&rdquo；、擴大朋友圈的呼聲似乎成了主流。

在DeepSeek這條鯰魚的衝擊之下，國內大模型企業展示出更&ldquo；開放&rdquo；的姿態，希望加快建立自己的開發者生態和應用生態。

而開源模型和閉源模型的關鍵差异，則可以從基礎條件、科技層面和商業化三個維度來觀察。

從基礎條件看，開源模型以公開數据集、社區貢獻數據為數據來源，以分佈式的、開發者自有的GPU集羣為算力支撐，為開發者、研究者、企業等提供了平等的接入機會，促進了科技的創新和共亯。

閉源模型則是由公司或團隊開發，以專有數據如用戶行為日誌、私有資料庫、清洗後公開數據為數據來源，用戶只能根據公司提供的介面或平臺使用這些模型。

從盈利場景看，開源模型本身並不直接帶來收益，但它們通常通過附加服務（如雲計算、技術支援、培訓、定制化開發等）來實現營利。公司可以通過商業化的管道提供增值服務，依託開源模型形成永續的收入來源。

閉源模型的商業化路徑相對直接，企業通過授權許可、訂閱服務、平臺收費等管道實現營利。閉源模型能為公司帶來高利潤，因為客戶需要為其使用許可權和服務支付費用。

開源與閉源並非&ldquo；水火不融&rdquo；，未來很可能會形成開源與閉源相互作用的形式，開源加速了AI科技的普及和創新，而閉源則確保科技能够在商業上獲得長足發展並維持穩定性

未來的贏家將是能同時掌握開源和閉源能力的多面手，，既通過開源獲取生態勢能，也利用閉源實現價值捕獲。

正如納德拉所說，& ldquo; 超大規模AI不會出現贏者通吃的局面，開源模式將制衡閉源。& rdquo;

尾聲

DeepSeek在當下的AI時代將扮演重要角色，就像Android之於移動互聯網革命。

重構產業生態，引發鏈式反應，加速上層應用發展與下層系統統一。這將調動起跨越軟硬體和上下游的生態力量，促使各方加大&ldquo；模型-晶片-系統&rdquo；協同優化與垂直打通的投入，進一步削弱CUDA生態優勢，為國產AI產業發展創造機遇。

DeepSeek通過技術創新，在AI模型訓練過程中實現了對高端進口晶片依賴的降低，這為國內企業展示了一條可行的科技路徑，極大地增强了國內企業自主研發算力晶片的信心。

博弈，不僅僅是開源以及閉源的科技選擇，更是涉及AI發展的話語權、市場主導權以及算力的分配的角逐。而這場AI權利爭奪戰已然開始。

歡迎加入深潮TechFlow官方社群

Telegram訂閱群： https://www.gushiio.com/TechFlowDaily

Twitter官方帳號： https://www.gushiio.com/TechFlowPost

Twitter英文账号：https://www.gushiio.com/DeFlow_Intern

原文網址：https://zh.gushiio.com/zixun/2769.html

國產大模型發展史：大模型競爭進入“後暴力計算時代”

01、中國AI項目乘政策風&ldquo； 井噴&rdquo；

02、從&ldquo； 燒錢信仰&rdquo； 到&ldquo； 效率革命&rdquo；

03、& ldquo; 開源&rdquo； 與&ldquo； 閉源&rdquo； 的協同

尾聲

相关推荐

發佈留言

01、中國AI項目乘政策風&ldquo；井噴&rdquo；

02、從&ldquo；燒錢信仰&rdquo；到&ldquo；效率革命&rdquo；

03、& ldquo; 開源&rdquo；與&ldquo；閉源&rdquo；的協同