從deepseek看“中國大模型那些事兒”
文|第一新聲,作者|金磊
自1956年約翰·麥卡錫在達特茅斯會議上首提“人工智慧”概念以來,ai領域已歷經半個多世紀的風雨。期間多數技術、架構的發展均未引起全社會的廣泛關注,直至2022年末,openai推出chatgpt引爆全球大模型熱潮,隨之,我國的ai大模型訓練也迎來井噴。
時間來到2025年,在過去兩年多的時間裡,儘管面臨美國多方面的“卡脖子”限制,但我國ai產業依然緊隨其後,穩健前行。北京時間2025年1月27日,來自中國的大模型應用deepseek在蘋果app store美國區免費應用下載榜超越chatgpt衝上第一。
deepseek美服登頂立即引起全球科技界乃至全社會的高度關注和好奇,狂歡就此開始……
deepseek的故事已無需贅述,借用圖靈獎得主楊立昆的話:“當人們看到deepseek的出色表現就認為‘中國在ai領域超越了美國’時,這其實是一種誤讀。正確的理解應該是‘開源模型正在超越閉源專有模型。& rsquo;”
我們不去探討“中國在ai領域超越了美國”這個結論是不是幻覺,按照國人的謙虛內斂,先三省吾身,自我內剖一下,中國的ai大模型產業發展到底怎麼樣?
乘政策東風,2024年中標項目增長5倍
從全球的視角來看,業界普遍將2023年作為人工智慧發展的分水嶺。
從1956年約翰·麥卡錫首次提出“人工智慧”概念,到1998年楊立昆(yann lecun,2018年圖靈獎得主)提出lenet-5(現代卷積神經網絡的起源之一),再到2017年google提出基於自注意力機制的transformer架構,為大模型的預訓練算法架構奠定了基礎……
2023年之前,關於人工智慧的技術探索和創新不勝枚舉,2023年ai大模型的火爆便是無數技術探索與沉澱後的大爆發,而openai發布chatgpt便是點燃了爆發的導火索。
視角切回國內,2023年同樣是中國“ai時代開啟元年”。在2023年以前,中國的科技樹上是什麼時候點亮人工智慧的?可能要追溯到863計劃,或者是2004年姚期智入職清華大學高等研究中心後“姚班”的誕生,又或者是2017年國務院印發《新一代人工智慧發展規劃》。這個問題可能沒有標準答案,但不積跬步無以至千里,中國人工智慧的發展同樣是厚積薄發,只是在2023年以前,因為沒有太大的社會關注度而容易被忽略。
時間來到2023年,從中央到地方,出台的各類指導文件、布局規劃、支持政策、管理措施等極為密集,強力驅動中國ai產業發展。
2月,《數字中國建設整體布局規劃》為ai技術的廣泛應用提供了頂層設計支持;
7月,《生成式人工智慧服務管理暫行辦法》是全球首個針對生成式ai的專門法規,標誌著中國在ai治理領域的領先嘗試;
9月,《科技倫理審查辦法(試行)》為ai技術的倫理治理提供了制度保障,推動負責任的技術創新;
10月,《算力基礎設施高質量發展行動計劃》為ai產業發展提供了強有力的基礎設施支撐,將進一步加速ai技術創新、降低研發成本、推動應用落地,並提升中國ai產業的國際競爭力。
更多政策不再一一列舉,總結2023的相關政策可以發現,已經涵蓋了技術研發、產業應用、數據管理、倫理治理、數據安全、保障措施等多個方面,不僅指明了中國ai的發展方向,也為中國ai產業發展提供了堅實的政策支撐。
借政策東風,中國掀起的“百模大戰”盛況空前。根據國家網信辦的數據,截至到2024年11月,deepseek未火爆出圈之前,我國已有3批次共計309個大模型通過國家網際網路信息辦公室備案,幾乎全面涵蓋了各類大模型和應用行業。
進入2024年,這種近乎“油門到底”的猛衝仍在持續。通過2023年大模型訓練的“百模大戰”,中國大模型開始在垂類行業眾多場景不斷落地。同時大模型的價格也在不斷降低,為廣泛商用打下基礎。根據第一新聲智庫不完全統計,2024年公開的大模型中標項目超過1000個,接近2023年的5倍,中標金額是2023年的4倍多。中國ai大模型產業發展正在加速駛入商用落地階段。
來源:第一新聲智庫《2024年中國ai大模型產業發展與應用研究報告》請輸入圖說
能力、性價比攀升,需求側驅動凸顯,多數央國企年投入超2億
ai大模型的商業化落地需要具備兩個基礎條件:足夠強的大模型能力以及足夠低的價格。
從能力上來看,對於大模型能力的評估涉及到參數規模、訓練資源需求、推理能力、推理資源需求、泛化能力、準確性、穩定性等等。
當前中國ai大模型的能力已經基本達到了廣泛商用的要求,並且仍在不斷進化當中。而進化路線主要有兩條:一是通過增加模型參數量、擴大數據集、提升訓練計算量來獲得性能更強大的大模型產品;二是通過優化模型架構適應性和計算效率,獲得更具性價比的產品,如70b參數的模型,通過優化架構和訓練策略,可獲得接近或超越更大規模模型的性能。
簡單一點來理解,第一種是美國科技巨頭推行的“算力堆砌”模式,或者叫“大力出奇蹟”。而第二種就是deepseek的破圈秘訣,通過數據策略、優化架構、工程創新,達成有限資源的極致利用,可以將其理解為“四兩撥千斤”。不僅繞過了美國算力封鎖,而且極大降低了大模型訓練成本,從而降低了客戶的使用門檻。
而價格方面,中國大模型價格下降趨勢仍在繼續。截止到2024年底,我國典型ai大模型的輸入價格下降至0.5元/百萬tokens以內。再到deepseek的橫空出世,一度將百萬tokens的輸入價格拉進“一毛時代”。
請輸入圖說deepseek優惠期間價格表
經過2023到2024兩年的大量實踐摸索,最終用戶開始逐步感受到大模型帶來的紅利和優勢,在我國當前的數位化轉型浪潮之中,市場需求側的驅動開始日益凸顯。
目前ai大模型商業模式主要有:定製化、api及訂閱模式、廣告與內容變現。而從這三類商業模式的維度進行觀察,大模型市場需求正在不斷攀升。其中,廣告模式在2024年的整體市場占比小於5%,因此本文不做重點關注,主要關註定制化、api及訂閱這兩類模式。
首先是面向大型政企的定製化模式,2024年市場占比約為55%。尤其是央國企客戶,背負著“引領示範打標杆”的重任,在2024年國資委提出要開展“ai+專項行動”以來,據招投標及相關公開信息,已有多數央企每年在大模型領域的投入超過了2億元。
其次是適用於中小企業及機構的api及訂閱模式,2024年市場占比為40%-45%。中小企業客戶傾向於採購maas和saas模式賦能業務,雖然單一中小企業需求有限,但數量眾多,覆蓋各行各業。以騰訊云為例,其maas服務用戶已超千家。
此外,講到商業模式還不得不提到大模型的開閉源之爭。雖然現在談開源與閉源孰優孰劣為時尚早,但deepseek的出現無疑為開源一方增添了重量砝碼。開源的商業化變現有付費支持、附加服務、定製開發、培訓認證等多種方式。
雖然,大模型開源在前期商業化方面存在一定難度,但在生態逐步完善以及積累海量用戶之後,市場空間值得期待。公開信息顯示,截至2025年2月,國內已有大量企業宣布接入deepseek大模型。這些企業包括三大運營商,比亞迪、吉利、極氪、東風、奇瑞等眾多車企,360數字安全集團、安恆信息、奇安信、亞信安全、安勝等安全企業,且數量仍在迅速增長中……
全產業共促,市場規模狂飆171%
實踐是檢驗真理的唯一標準,ai大模型性能再突出不能落地應用也終將成為擺件。黑貓白貓抓到老鼠才是好貓,中國ai大模型產業中,有著眾多好貓。這些好貓不只是deepseek這樣的大模型企業,還包括從基礎設施到數據,從工具到各類型應用廠商等全產業鏈上的所有企業及機構。
可以看到,正是國家政府組織的科研機構、清華這樣的高校、華為這樣的中國科技巨頭、deepseek這樣的初創企業、中國成千上萬的中小企業共同組成了中國ai領域的中堅力量。
來源:第一新聲智庫《2024年中國ai大模型產業發展與應用研究報告》
中國ai全產業除了“集中力量辦大事”以外,還要有很多“大事”可以辦。ai在中國能辦的“大事”實在太多,因為中國擁有龐大的市場需求和極為豐富的應用場景,為ai大模型的應用提供了廣闊的發揮空間。
來源:第一新聲智庫《2024年中國ai大模型產業發展與應用研究報告》
據第一新聲智庫研究,2024年中國ai大模型應用市場規模已經達到157億元,同比增速達到171%,預計2027年將衝破千億大關,達到1130億元。
這還只是基於ai大模型應用市場分析統計及預測的結果,僅包括企業用戶購買大模型產品、大模型服務、大模型應用服務和軟硬一體化大模型應用平台形成的市場總量。如果從ai大模型的深度布局,延伸至行業上下游的廣泛滲透,直至輻射並重塑整個產業生態,未來這一領域的產業規模無疑將展現出極為可觀的增長潛力與發展空間。
來源:第一新聲智庫《2024年中國ai大模型產業發展與應用研究報告》
成果振奮人心,未來道阻且長
我國當前在ai大模型領域取得的成果確實足夠振奮人心,deepseek的成績也有目共睹。但這些在整箇中美科技博弈乃至中國科技強國的長遠征途中,我們只是邁出了一小步。
在肯定成果的同時更是要保持冷靜客觀,認清差距。
文章的結尾,拋給deepseek一個問題:“中國ai大模型產業面臨哪些挑戰?& rdquo;
deepseek給出了以下回答:
1.技術瓶頸
算力限制:大模型訓練需要大量計算資源,如高性能gpu和tpu,但這些硬體主要依賴進口,國內自主研發的高端晶片與國際領先水平仍有差距。
算法創新不足:儘管中國在應用層面表現突出,但在基礎算法和理論研究上仍落後於美國等國家,原創性突破較少。
數據質量與隱私問題:高質量數據是大模型訓練的關鍵,但數據標註成本高,且數據隱私和安全問題限制了數據的獲取與使用。
2.人才短缺
高端人才匱乏:ai領域,尤其是大模型研發,需要頂尖科學家和工程師,但國內高端人才數量不足,且面臨國際競爭。
人才培養體系不完善:高校ai教育與實踐脫節,難以滿足產業對複合型人才的需求。
3.商業化與落地難題
應用場景有限:大模型在部分領域已取得進展,但在醫療、金融等行業的落地仍面臨技術和監管障礙。
成本高企:大模型訓練和部署成本高昂,中小企業難以承擔,限制了其廣泛應用。
商業模式不成熟:如何將大模型技術轉化為可持續的商業模式仍在探索中。
4.國際競爭與地緣政治
技術封鎖:美國等國家對高端晶片和技術的出口限制,影響中國大模型產業的發展。
國際競爭加劇:全球ai競爭激烈,中國需在技術、應用和生態建設上加快步伐以保持競爭力。
5.政策與監管
政策支持與監管平衡:雖然政府大力支持ai發展,但數據隱私、算法公平等監管問題仍需完善,如何在創新與監管間找到平衡是關鍵。
標準化不足:大模型產業缺乏統一標準,導致技術互通和協作困難,影響生態建設。
6.生態建設
產業鏈不完善:大模型發展依賴晶片、框架、應用等環節的協同,但國內產業鏈尚未完全成熟,生態建設滯後。
開源社區影響力不足:儘管國內開源社區在成長,但國際影響力仍較弱,難以吸引全球開發者。
7.能源與環境問題
能耗高:大模型訓練消耗大量能源,與“雙碳”目標存在衝突,如何在發展ai的同時實現綠色計算是重要挑戰。
總體而言,當前中國ai大模型產業在技術、人才、商業化、國際競爭、政策、生態和能源等方面仍面臨多重挑戰。解決這些問題需要政府、企業和學術界的共同努力,推動技術創新、人才培養和政策優化,以實現可持續發展。
原文網址:https://zh.gushiio.com/ai/1029.html