國產大模型發展史:大模型競爭進入“後暴力計算時代”

後浪兇猛進化,前浪披荊斬棘。

作者:關鍵幀

國產大模型發展史:大模型競爭進入“後暴力計算時代”插图1

圖片來源:由無界AI生成

AI競技場正靜靜見證著一場深刻的科技權力騰挪。

這場由DeepSeek引發的變革仍未見平息,大模型競爭進入“ 後暴力計算時代”, 效率的重要性躍然紙上,而AI權力也面臨重構, OpenAI“ 一家獨大” 的局面正不斷受到衝擊。

後浪兇猛進化,前浪披荊斬棘,& ldquo; 城頭變幻大王旗” 贏家尚未有定論,如何既通過開源獲取生態的加持,又利用閉源實現商業變現,才是決勝的關鍵。

01、中國AI項目乘政策風“ 井噴”

國產AI的發展在不聲不響間悄然醞釀。 2023年被業內人士視為人工智慧發展的分水嶺。

人工智慧科學家李飛飛曾說:& ldquo; 在歷史上,2023年有望因科技的深刻變化和公眾覺醒而被人們銘記。& rdquo;

而在此之前,關於人工智慧的科技探索和創新早已不勝枚舉。

1956年約翰· 麥卡錫在達特茅斯會議上首次提出“ 人工智慧” (Artificial Intelligence)概念,AI作為一門學科正式誕生。

但到了1973年,由於AI研究遭遇瓶頸,對AI的資金投入大幅縮水,發展進入“ 寒冬”。

1986年,直到“ AI教父” 傑佛瑞· 辛頓(Geoffrey Hinton)提出了反向傳播(Backpropagation)算灋,神經網路的復興讓AI發展再迎曙光,再到2017年Google提出基於自注意力機制(Self-Attention),取代RNN/LSTM,成為後續大語言模型(LLM)的覈心架構…& hellip;

回望國內的AI發展歷程,2023年同樣是“ 國產AI時代開啟元年”。

據天眼查,僅2023年上半年與大模型直接相關的融資事件超20起,國內已發佈的各類大模型數量超過100個,而到了2024年7月時完成備案並上線的生成式AI大模型數量接近200個。

直到今天,有機會沖進決賽圈的依然只有十幾家。 諮詢機構弗若斯特沙利文指出,我們現時在通用基礎大模型領域的競爭者已縮減至20餘家,主要由互聯網企業、云計算巨頭及人工智慧創業公司主導。

大家都是這場沒有硝烟的“ 戰爭” 的親歷者,站在2025年的開年回望,或許是經歷了2024年“ 百模大戰” 的大浪淘沙,DeepSeek才得以在2025年開年在全球科技行業投擲下“ 驚雷”, 推動國產AI實現了" 關鍵一躍", 站穩腳跟。

擁有持續創新能力的企業逐漸佔據市場主導,從圖文轉視頻到多語言廣告生成,人工智慧的應用範圍正在迅速拓展。

與此同時,大模型和智慧體科技也進入了加速發展階段。 無論是C端的用戶體驗優化,還是B端的企業解決方案,智慧體和大模型正在重新定義科技與社會的連接管道。

決賽圈裏目前有三股力量:一是阿裡巴巴、位元組跳動代表的互聯網大廠、雲服務商,介入大模型; 二是科大訊飛代表的人工智慧國家隊,以G/B/C聯動的管道,既做解決方案又做硬體產品; 三是智譜、DeepSeek等AI創業公司,少數還在堅持基礎模型創新。

產業鏈上下游處境分化,模型廠商發展路徑分野。 即便“ AI六小虎”, 也面臨道路分化。 例如,百川智慧已轉向醫療等行業大模型; 零一萬物將超級大模型訓練交給阿裡; 月之暗面和MiniMax專注做C端應用和產品。

業內人士普遍認為,與產業鏈上下游相比,處於中游的模型廠商普遍面臨盈利困境。 2025年,大模型決賽圈的選手,還能在基礎大模型層創新的企業,會進一步减少。

02、從“ 燒錢信仰” 到“ 效率革命”

如果說“ 成本、 AI Agent、 多模態” 是當下AI產業的三個關鍵字,代表著2024年大模型的進化方向,那麼它們或許也代表著大模型邁向產業落地的關鍵節點。

首先,成本無疑是决定企業生死的關鍵,訓練和部署大規模AI模型對計算資源的龐大需求不容忽視,這也使得企業必須背負高昂的計算成本和運維成本。

DeepSeek-R1也正是抓了企業在效率和成本控制上的痛點,實現了在相對較低的算力投入下,可媲美甚至超越頭部模型的效能表現。

傳統人工智慧發展模式往往依賴於“ 規模至上” 的邏輯,追求超大規模模型和超大規模算力集羣。 DeepSeek R1的輕量化模型和開源策略,降低了人工智慧應用的門檻,促進了中端算力設施和分佈式資料中心的普及。

產業鏈上游的英偉達,因DeepSeek的出現開始面臨一定需求結構調整的壓力。

ASIC晶片廠商則迎來了新的發展機遇。 由於ASIC晶片能够針對特定人工智慧應用進行硬體加速,在能效比和成本控制上具有明顯優勢,更適應分佈式算力發展的趨勢。

對於算力服務端來說,區域性資料中心憑藉低時延和貼近應用場景的優勢,開始承接製造業智慧質檢、金融風控等對延遲敏感的應用需求。

AWS、 阿裡雲等云計算巨頭調整部分大型資料中心的建設策略,加大在邊緣計算和分佈式算力佈局方面的投入。

而應用端則將受益於算力成本的下降,驅動人工智慧在製造業、金融、醫療等領域的滲透加速。

在程式碼託管平臺GitHub上,已湧現出大量基於DeepSeek模型的集成應用案例(awesome deepseek integration),形成“ 需求牽引供給” 的正向迴圈,實現“ 算力+行業” 的雙向賦能。

人工智慧科技將加速滲透到各行各業,成為推動產業升級和經濟發展的重要引擎。

但值得關注的是,DeepSeek R1的科技突破,在降低人工智慧應用門檻的同時,也可能引發“ 傑文斯悖論”。

傑文斯悖論由19世紀經濟學家William Stanley Jevons提出,他發現,隨著煤炭使用效率的提高,煤炭的消耗總量反而新增。 這一悖論揭示了一個深刻的經濟規律:效率的提升並不必然導致資源消耗的减少,反而可能因為成本降低和應用範圍擴大,刺激需求增長,最終導致資源消耗總量新增。

微軟CEO薩提亞· 納德拉引用傑文斯悖論來解釋DeepSeek R1可能帶來的影響,可謂一針見血。

納德拉認為,更實惠、更易於訪問的人工智慧科技,將通過更快的普及和更廣泛的應用,導致需求的激增。
隨著人工智慧科技的門檻降低,過去由於成本限制而無法應用人工智慧的領域,例如中小企業、邊緣計算場景等,將湧現出大量新的應用需求,從而導致算力調用密度指數級上升。

新興應用場景的爆發,也將加速算力需求的裂變。 智慧駕駛、具身機器人等前沿領域對實时算力的需求極為龐大,遠超DeepSeek科技優化的速度。 即使單任務效率提升數倍,百萬級智慧終端的併發需求,仍將形成巨大的算力吞噬黑洞。

03、& ldquo; 開源” 與“ 閉源” 的協同

隨著開源大模型DeepSeek的“ 爆火”,& ldquo; 開源” 和“ 免費” 等關鍵字頻現。

如果說,在DeepSeek之前,國內大模型企業關於“ 開源” 和“ 閉源” 的路徑仍多有分歧,現在“ 開源”、& ldquo; 開放生態”、 擴大朋友圈的呼聲似乎成了主流。

在DeepSeek這條鯰魚的衝擊之下,國內大模型企業展示出更“ 開放” 的姿態,希望加快建立自己的開發者生態和應用生態。

而開源模型和閉源模型的關鍵差异,則可以從基礎條件、科技層面和商業化三個維度來觀察。

從基礎條件看,開源模型以公開數据集、社區貢獻數據為數據來源,以分佈式的、開發者自有的GPU集羣為算力支撐,為開發者、研究者、企業等提供了平等的接入機會,促進了科技的創新和共亯。

閉源模型則是由公司或團隊開發,以專有數據如用戶行為日誌、私有資料庫、清洗後公開數據為數據來源,用戶只能根據公司提供的介面或平臺使用這些模型。

從盈利場景看,開源模型本身並不直接帶來收益,但它們通常通過附加服務(如雲計算、技術支援、培訓、定制化開發等)來實現營利。 公司可以通過商業化的管道提供增值服務,依託開源模型形成永續的收入來源。

閉源模型的商業化路徑相對直接,企業通過授權許可、訂閱服務、平臺收費等管道實現營利。 閉源模型能為公司帶來高利潤,因為客戶需要為其使用許可權和服務支付費用。

開源與閉源並非“ 水火不融”, 未來很可能會形成開源與閉源相互作用的形式,開源加速了AI科技的普及和創新,而閉源則確保科技能够在商業上獲得長足發展並維持穩定性

未來的贏家將是能同時掌握開源和閉源能力的多面手,,既通過開源獲取生態勢能,也利用閉源實現價值捕獲。

正如納德拉所說,& ldquo; 超大規模AI不會出現贏者通吃的局面,開源模式將制衡閉源。& rdquo;

尾聲

DeepSeek在當下的AI時代將扮演重要角色,就像Android之於移動互聯網革命。

重構產業生態,引發鏈式反應,加速上層應用發展與下層系統統一。 這將調動起跨越軟硬體和上下游的生態力量,促使各方加大“ 模型-晶片-系統” 協同優化與垂直打通的投入,進一步削弱CUDA生態優勢,為國產AI產業發展創造機遇。

DeepSeek通過技術創新,在AI模型訓練過程中實現了對高端進口晶片依賴的降低,這為國內企業展示了一條可行的科技路徑,極大地增强了國內企業自主研發算力晶片的信心。

博弈,不僅僅是開源以及閉源的科技選擇,更是涉及AI發展的話語權、市場主導權以及算力的分配的角逐。 而這場AI權利爭奪戰已然開始。

歡迎加入深潮TechFlow官方社群

Telegram訂閱群: https://www.gushiio.com/TechFlowDaily

Twitter官方帳號: https://www.gushiio.com/TechFlowPost

Twitter英文账号:https://www.gushiio.com/DeFlow_Intern

原文網址:https://zh.gushiio.com/zixun/2769.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *