國產大模型發展史:大模型競爭進入“後暴力計算時代”
後浪兇猛進化,前浪披荊斬棘。
作者:關鍵幀
圖片來源:由無界AI生成
AI競技場正靜靜見證著一場深刻的科技權力騰挪。
這場由DeepSeek引發的變革仍未見平息,大模型競爭進入“ 後暴力計算時代”, 效率的重要性躍然紙上,而AI權力也面臨重構, OpenAI“ 一家獨大” 的局面正不斷受到衝擊。
後浪兇猛進化,前浪披荊斬棘,& ldquo; 城頭變幻大王旗” 贏家尚未有定論,如何既通過開源獲取生態的加持,又利用閉源實現商業變現,才是決勝的關鍵。
01、中國AI項目乘政策風“ 井噴”
國產AI的發展在不聲不響間悄然醞釀。 2023年被業內人士視為人工智慧發展的分水嶺。
人工智慧科學家李飛飛曾說:& ldquo; 在歷史上,2023年有望因科技的深刻變化和公眾覺醒而被人們銘記。& rdquo;
而在此之前,關於人工智慧的科技探索和創新早已不勝枚舉。
1956年約翰·; 麥卡錫在達特茅斯會議上首次提出“ 人工智慧” (Artificial Intelligence)概念,AI作為一門學科正式誕生。
但到了1973年,由於AI研究遭遇瓶頸,對AI的資金投入大幅縮水,發展進入“ 寒冬”。
1986年,直到“ AI教父” 傑佛瑞·; 辛頓(Geoffrey Hinton)提出了反向傳播(Backpropagation)算灋,神經網路的復興讓AI發展再迎曙光,再到2017年Google提出基於自注意力機制(Self-Attention),取代RNN/LSTM,成為後續大語言模型(LLM)的覈心架構…& hellip;
回望國內的AI發展歷程,2023年同樣是“ 國產AI時代開啟元年”。
據天眼查,僅2023年上半年與大模型直接相關的融資事件超20起,國內已發佈的各類大模型數量超過100個,而到了2024年7月時完成備案並上線的生成式AI大模型數量接近200個。
直到今天,有機會沖進決賽圈的依然只有十幾家。 諮詢機構弗若斯特沙利文指出,我們現時在通用基礎大模型領域的競爭者已縮減至20餘家,主要由互聯網企業、云計算巨頭及人工智慧創業公司主導。
大家都是這場沒有硝烟的“ 戰爭” 的親歷者,站在2025年的開年回望,或許是經歷了2024年“ 百模大戰” 的大浪淘沙,DeepSeek才得以在2025年開年在全球科技行業投擲下“ 驚雷”, 推動國產AI實現了"; 關鍵一躍";, 站穩腳跟。
擁有持續創新能力的企業逐漸佔據市場主導,從圖文轉視頻到多語言廣告生成,人工智慧的應用範圍正在迅速拓展。
與此同時,大模型和智慧體科技也進入了加速發展階段。 無論是C端的用戶體驗優化,還是B端的企業解決方案,智慧體和大模型正在重新定義科技與社會的連接管道。
決賽圈裏目前有三股力量:一是阿裡巴巴、位元組跳動代表的互聯網大廠、雲服務商,介入大模型; 二是科大訊飛代表的人工智慧國家隊,以G/B/C聯動的管道,既做解決方案又做硬體產品; 三是智譜、DeepSeek等AI創業公司,少數還在堅持基礎模型創新。
產業鏈上下游處境分化,模型廠商發展路徑分野。 即便“ AI六小虎”, 也面臨道路分化。 例如,百川智慧已轉向醫療等行業大模型; 零一萬物將超級大模型訓練交給阿裡; 月之暗面和MiniMax專注做C端應用和產品。
業內人士普遍認為,與產業鏈上下游相比,處於中游的模型廠商普遍面臨盈利困境。 2025年,大模型決賽圈的選手,還能在基礎大模型層創新的企業,會進一步减少。
02、從“ 燒錢信仰” 到“ 效率革命”
如果說“ 成本、 AI Agent、 多模態” 是當下AI產業的三個關鍵字,代表著2024年大模型的進化方向,那麼它們或許也代表著大模型邁向產業落地的關鍵節點。
首先,成本無疑是决定企業生死的關鍵,訓練和部署大規模AI模型對計算資源的龐大需求不容忽視,這也使得企業必須背負高昂的計算成本和運維成本。
DeepSeek-R1也正是抓了企業在效率和成本控制上的痛點,實現了在相對較低的算力投入下,可媲美甚至超越頭部模型的效能表現。
傳統人工智慧發展模式往往依賴於“ 規模至上” 的邏輯,追求超大規模模型和超大規模算力集羣。 DeepSeek R1的輕量化模型和開源策略,降低了人工智慧應用的門檻,促進了中端算力設施和分佈式資料中心的普及。
產業鏈上游的英偉達,因DeepSeek的出現開始面臨一定需求結構調整的壓力。
ASIC晶片廠商則迎來了新的發展機遇。 由於ASIC晶片能够針對特定人工智慧應用進行硬體加速,在能效比和成本控制上具有明顯優勢,更適應分佈式算力發展的趨勢。
對於算力服務端來說,區域性資料中心憑藉低時延和貼近應用場景的優勢,開始承接製造業智慧質檢、金融風控等對延遲敏感的應用需求。
AWS、 阿裡雲等云計算巨頭調整部分大型資料中心的建設策略,加大在邊緣計算和分佈式算力佈局方面的投入。
而應用端則將受益於算力成本的下降,驅動人工智慧在製造業、金融、醫療等領域的滲透加速。
在程式碼託管平臺GitHub上,已湧現出大量基於DeepSeek模型的集成應用案例(awesome deepseek integration),形成“ 需求牽引供給” 的正向迴圈,實現“ 算力+行業” 的雙向賦能。
人工智慧科技將加速滲透到各行各業,成為推動產業升級和經濟發展的重要引擎。
但值得關注的是,DeepSeek R1的科技突破,在降低人工智慧應用門檻的同時,也可能引發“ 傑文斯悖論”。
傑文斯悖論由19世紀經濟學家William Stanley Jevons提出,他發現,隨著煤炭使用效率的提高,煤炭的消耗總量反而新增。 這一悖論揭示了一個深刻的經濟規律:效率的提升並不必然導致資源消耗的减少,反而可能因為成本降低和應用範圍擴大,刺激需求增長,最終導致資源消耗總量新增。
微軟CEO薩提亞·; 納德拉引用傑文斯悖論來解釋DeepSeek R1可能帶來的影響,可謂一針見血。
納德拉認為,更實惠、更易於訪問的人工智慧科技,將通過更快的普及和更廣泛的應用,導致需求的激增。
隨著人工智慧科技的門檻降低,過去由於成本限制而無法應用人工智慧的領域,例如中小企業、邊緣計算場景等,將湧現出大量新的應用需求,從而導致算力調用密度指數級上升。
新興應用場景的爆發,也將加速算力需求的裂變。 智慧駕駛、具身機器人等前沿領域對實时算力的需求極為龐大,遠超DeepSeek科技優化的速度。 即使單任務效率提升數倍,百萬級智慧終端的併發需求,仍將形成巨大的算力吞噬黑洞。
03、& ldquo; 開源” 與“ 閉源” 的協同
隨著開源大模型DeepSeek的“ 爆火”,& ldquo; 開源” 和“ 免費” 等關鍵字頻現。
如果說,在DeepSeek之前,國內大模型企業關於“ 開源” 和“ 閉源” 的路徑仍多有分歧,現在“ 開源”、& ldquo; 開放生態”、 擴大朋友圈的呼聲似乎成了主流。
在DeepSeek這條鯰魚的衝擊之下,國內大模型企業展示出更“ 開放” 的姿態,希望加快建立自己的開發者生態和應用生態。
而開源模型和閉源模型的關鍵差异,則可以從基礎條件、科技層面和商業化三個維度來觀察。
從基礎條件看,開源模型以公開數据集、社區貢獻數據為數據來源,以分佈式的、開發者自有的GPU集羣為算力支撐,為開發者、研究者、企業等提供了平等的接入機會,促進了科技的創新和共亯。
閉源模型則是由公司或團隊開發,以專有數據如用戶行為日誌、私有資料庫、清洗後公開數據為數據來源,用戶只能根據公司提供的介面或平臺使用這些模型。
從盈利場景看,開源模型本身並不直接帶來收益,但它們通常通過附加服務(如雲計算、技術支援、培訓、定制化開發等)來實現營利。 公司可以通過商業化的管道提供增值服務,依託開源模型形成永續的收入來源。
閉源模型的商業化路徑相對直接,企業通過授權許可、訂閱服務、平臺收費等管道實現營利。 閉源模型能為公司帶來高利潤,因為客戶需要為其使用許可權和服務支付費用。
開源與閉源並非“ 水火不融”, 未來很可能會形成開源與閉源相互作用的形式,開源加速了AI科技的普及和創新,而閉源則確保科技能够在商業上獲得長足發展並維持穩定性
未來的贏家將是能同時掌握開源和閉源能力的多面手,,既通過開源獲取生態勢能,也利用閉源實現價值捕獲。
正如納德拉所說,& ldquo; 超大規模AI不會出現贏者通吃的局面,開源模式將制衡閉源。& rdquo;
尾聲
DeepSeek在當下的AI時代將扮演重要角色,就像Android之於移動互聯網革命。
重構產業生態,引發鏈式反應,加速上層應用發展與下層系統統一。 這將調動起跨越軟硬體和上下游的生態力量,促使各方加大“ 模型-晶片-系統” 協同優化與垂直打通的投入,進一步削弱CUDA生態優勢,為國產AI產業發展創造機遇。
DeepSeek通過技術創新,在AI模型訓練過程中實現了對高端進口晶片依賴的降低,這為國內企業展示了一條可行的科技路徑,極大地增强了國內企業自主研發算力晶片的信心。
博弈,不僅僅是開源以及閉源的科技選擇,更是涉及AI發展的話語權、市場主導權以及算力的分配的角逐。 而這場AI權利爭奪戰已然開始。
歡迎加入深潮TechFlow官方社群
Telegram訂閱群: https://www.gushiio.com/TechFlowDaily
Twitter官方帳號: https://www.gushiio.com/TechFlowPost
Twitter英文账号:https://www.gushiio.com/DeFlow_Intern
原文網址:https://zh.gushiio.com/zixun/2769.html