深度思考:有關DeepSeek、科技競爭、AGI的一切

這場關乎人類未來的科技競賽,現在走進了“競速賽”階段。

深度思考:有關DeepSeek、科技競爭、AGI的一切插图1

圖片來源:由無界AI生成

2025年剛剛拉開序幕,中國在AI領域就掀起了一場前所未有的浪潮。

DeepSeek異軍突起,以其“ 低成本+開源” 的優勢橫掃全球市場,在iOS與穀歌應用商店實現雙端登頂。 Sensor Tower的資料顯示,截至1月31日,DeepSeek日活用戶已達ChatGPT的40%,並以每日近500萬新增下載量的速度持續擴張,被業界稱為“ 來自東方的神秘力量”。

面對“ 來勢洶洶” 的DeepSeek,矽谷還沒有形成共識。

AI大數據公司Palantir CEO卡普在採訪中表示,DeepSeek等競爭對手的崛起表明美國需要加快開發先進的人工智慧。 山姆· 奧特曼在接受《Radio www.gushiio.coms》時提到,雖然DeepSeek在產品和價格上做得不錯,但對它的出現也並不意外。 馬斯克則多次表示其並沒有革命性的突破,很快就有團隊發佈效能更好的模型。

2月9日,葦草智酷、資訊時代50人論壇、騰訊科技聯合發起的AGI之路系列直播《再談DeepSeek的成就和AGI的未來》線上研討會,邀請經濟學家、橫琴數鏈數位金融研究院學術委員會主席朱嘉明,中國自動化學會監事長、中國科學院自動化研究所研究員王飛躍,EmojiDAO創始人賀寶輝三比特嘉賓,圍繞“ AGI發展路線”& ldquo; 如何‘ 複製’ 下一個DeepSeek”& ldquo; 大模型的去中心化” 分別進行主題分享。

朱嘉明教授對AI的發展速度極其樂觀,他說原始社會技術進步的週期是以10萬年為組織,農業社會以千年為組織,工業社會是100年,互聯網時代基本以十年為組織,進入到人工智慧時代,它的速度更加難以想像地加快,& ldquo; 人工智慧從現在開始走向AGI或ASI,不保守地說是2-3年時間,比較保守的是5-6年時間。& rdquo;

在朱嘉明教授看來,人工智慧未來的發展將會出現分叉:一種是更前沿、尖端、高成本的路線,旨在研究人類未知的領域; 一種是走向低成本、大規模的大眾化路線,& ldquo; 人工智慧向新階段發展時永遠存在兩條路線,一條是新階段的從“ 0到1”, 一條是從“ 1到10”。& rdquo;

王飛躍教授綜合國內外AI科技的發展,強調DeepSeek今天的成就重塑了中國投資、引領人工智慧科技和產業的信心,他認為OpenAI不會共亯超級智慧,只會把其他公司逼到死角。

對於如何孵化出更多DeepSeek這樣的團隊,王飛躍引用AlphaGo、ChatGPT誕生的案例強調DeSci去中心化科研模式的價值,& ldquo; (我們)不能全靠規劃、靠舉國體制來發展人工智慧科技。& rdquo;

而關於DeepSeek大規模使用數據蒸餾科技,業內有不少批判的聲音,甚至將蒸餾比作盜竊,王飛躍則表示自己想為知識蒸餾“ 正名”, 他說,& ldquo; 知識蒸餾本質上是一種教育形式的變形,不能因為人的知識來自於老師,就認為自己無法超越老師。& rdquo;

賀寶輝和王飛躍一樣看重去中心化的價值,在他看來去中心化是深度學習模型降本路徑,也是算力網絡和資料安全的關鍵。

“ 去中心化的算力網絡和資料存儲,如Filecoin的存儲成本遠低於傳統雲服務(如AWS),大幅降低了成本。& rdquo; 賀寶輝說,& ldquo; 去中心化的管理機制(可以)確保沒有人可以單方面改變這些網絡和數據。& rdquo;

對於大模型之後的Agent,賀寶輝將其看作是生命的一種,& ldquo; 我認為它不僅僅是工具,更是一種生命,我們創造AI並不意味著完全主宰它。& rdquo;, 賀寶輝說,& ldquo; 我非常關注如何讓Agent實現‘ 永生’, 並在去中心化的網絡中獨立存在,成為一個全新的‘ 物種’。& rdquo;

以下為直播分享實錄精華(在不改變原意的情况下有删减、調整):

朱嘉明

人工智慧的發展

只有“ 0到1”、& ldquo; 1到10” 兩條路

今天我想講的題目是人工智慧進化尺度和大模型,副標題是DeepSeek V3和R1系列現象分析。

主要講五個問題:人工智慧進化時間尺度、人工智慧生態系統、如何全面和客觀評估DeepSeek、DeepSeek引發的全球反應、2025年人工智慧趨勢的展望。

首先,人工智慧的實際進化時間尺度,遠比專家包括人工智慧領域的科學家預期的要快。

在人類漫長的歷史過程中,我們經歷過農耕社會、工業社會、資訊時代,現在進入到人工智慧時代。 在這個歷史過程中,科技進化的時間週期不斷縮短。

原始社會技術進步的週期是以10萬年為組織; 農耕社會以千年為組織; 工業社會技術進步週期長則100年,短則10年; 互聯網時代以30年-10年為組織; 進入到人工智慧時代,它的速度更加難以想像地加快。

GPT-3出現之前,人們預計人工智慧走到AGI時代大概需要80年的時間; GPT-3出現之後,人們把這樣的預期縮短到50年; 到了出現LLaMda2的時候,大家的預期又變成18年。

2025年,人們對實現AGI的時間預期可能更短,保守地說是5-6年時間,樂觀地說的是5-6年時間。

對照下圖,我們可以清楚地看到,人工智慧相較於人類歷史上的任何科技革命、技術創新,具備顯而易見的加速度特徵。

深度思考:有關DeepSeek、科技競爭、AGI的一切插图3

如果用宇宙第一速度、第二速度、第三速度來描述人工智慧現在的高速發展。 現時,人工智慧已經完成了從宇宙第一速度到宇宙第二速度的轉變—& mdash; 人工智慧開始進入高度自主性,脫離人類束縛。

至於在什麼樣的情况脫離太陽引力的束縛進入宇宙第三速度,我們不得而知。 但可以肯定的是,人工智慧已經完成了從通用人工智慧到超級人工智慧的飛躍。 2017年之後,人工智慧正以年、月、周的頻率發生劇烈的變革和陞級。

為什麼人工智慧呈現指數加速現象,進入到“ 宇宙第二速度” 階段? 我認為有三個非常重要的原因。

●第一,正如馬斯克所講,到2024年底,用於訓練模型的數據已經耗盡,大模型基本用完了人類存量知識。 2025年開始,大模型更大的目標是尋找增量數據,這是一個歷史性轉折—& mdash; 人工智慧大模型完成了從粗放到集約的轉型;

●第二,人工智慧的硬體始終在持續進化;

●第三,人工智慧已經進入到“ 依賴人工智慧本身” 的發展階段—& mdash; 可以自我發展。

當前,包括OpenAI、DeepMind以及Meta這些公司的大模型矩陣,形成了一個相互依存、相互促進的機制。 人工智慧的生態構建遵循縱向速度突破驅動橫向生態裂變法則。 在橫向生態層面,多模態融合革命、垂直領域滲透加速、分佈式認知網絡這三大範式正在重構科技格局。

在不斷成熟的人工智慧生態情况下,自然產生溢出效應(泛化效應),並基本上滲透到科學、經濟、社會以及人們的認知層面。

對於春節期間爆火的現象級產品, DeepSeek, 我們如何全面和客觀地評估DeepSeek?

首先,DeepSeek被國內外媒體持續關注,並引發了世界範圍福斯的體驗性使用,形成一場巨大的衝擊波。 輿論在歷史上起到非常重要的作用。 有些事件被輿論放大,有些事件則被輿論低估,經過一段時間最終會回歸其在歷史上的本來狀態。

DeepSeek V3主要具備高性能、高效訓練、快速回應,特別適應中文環境這四個顯著的優勢。 DeepSeek-R1則主要包含計算效能强、推理能力出色、功能特性好、場景適用性强等優點。

當然,DeepSeek還存在著一些需要改善或者面臨挑戰的問題—& mdash; 如何提高正確率的問題? 如何解决多模態的輸出和輸入問題? 硬體方面服務器的穩定性問題,以及如何處理難以回避的越來越增多的敏感話題問題。

深度思考:有關DeepSeek、科技競爭、AGI的一切插图5

這些問題當中,最值得討論,也是大家最為關注的是人工智慧大模型成本,它和工業產品成本的概念和結構有著一系列根本性差別。

人工智慧大模型的成本,首先在於基礎設施。 DeepSeek之所以在基礎設施成本上顯示它的優越性,是大量地使用相對低價格的A100(晶片); 其次是研發成本,涉及到算灋複用的成本,在這方面DeepSeek具有一定的優勢; 再者,需要關注數據成本、引入新興技術的成本以及綜合計算中的成本結構。

關於成本的討論,也會涉及到技術路線問題—& mdash; 人工智慧向新階段發展時永遠存在兩條路線,一條是新階段的從“ 0到1”, 一條是從“ 1到10”。 未來發展的任何階段,只要選擇“ 0到1” 的路線,成本必然會上升; 而選擇從“ 1到10” 的路線,則有可能通過提高效率來降低成本。

“ 從0到1” 的路線之下,DeepSeek在基準測試中表現可圈可點,尤其是HLE(Humanity’s Last Exam,人類最後的測試)標準集—& mdash; 整理了全球50個國家和地區、500多個機构設計的3000個問題,涵蓋知識儲備、邏輯推理、跨域遷移等核心能力評估。

在HLE基準測試當中,DeepSeek達到的準確數達到了9.4,比它更强的是OpenAI o3; 當然它在這個領域中遠遠超過了GPT-4o和Grok-2,這應該是相當耀眼的一個成績。

深度思考:有關DeepSeek、科技競爭、AGI的一切插图7

我們都知道,DeepSeek推出後,包括微軟、穀歌、英偉達等在內的全球人工智慧公司都作出了不同程度的反應。 這意味著人工智慧在進化過程中,其平衡點在不斷被打破—& mdash; 當出現一種全新的人工智慧突破時,會形成壓力,進而刺激整個系統做出反應; 而這種反應又催生新的突破,產生新的壓力,形成新的平衡點。

現在,這種影響和反應的週期在不斷縮小。 我們會發現,人工智慧競爭是一個相當發散的模式,為創新和突破提供了比較大的發展空間。

在人工智慧的進化尺度與大模型生態的展望中,科技發展呈現出“ 領先— 挑戰— 突破— 再領先” 的動態迴圈模式。 這一過程並非零和博弈,而是通過持續反覆運算推動整體生態的螺旋上升。

深度思考:有關DeepSeek、科技競爭、AGI的一切插图9

最後,我想講一講對2025年人工智慧發展趨勢的展望。

人工智慧走到今天存在著兩種方向,一個是專業化高端路線,擴張前沿,探索未知領域。 還有一條道路就是福斯普及路線,此類大模型以降低使用門檻、滿足廣泛用戶基礎需求為覈心目標。

現在,人類到了一個全新的時代,人工智慧既是顯微鏡又是望遠鏡,它將幫助我們認知那些現階段連顯微鏡和望遠鏡都無法觸及的、更深邃複雜的物理世界。

未來人工智慧必然呈現出多元且多元的格局。 就像樂高積木,甚至類似於魔方,它們不斷組合和重構,將演繹出一個超出我們自身知識和經驗限制的全新世界。

人工智慧的進一步突破,需要不斷加大的資本投入。 人工智慧的需求正在迅速消耗現有的資料中心容量,促使公司建設新的設施。

總之,人工智慧正在走向“ 頂天立地”:& ldquo; 頂天” 就是在不斷探索未知領域的過程中,提高類比物理世界的質量;& ldquo; 立地” 就是接地氣,推動人工智慧降低成本,全方位的落地,惠及群眾。 在這樣的背景下,可以更加客觀全面地看到DeepSeek的優勢、局限以及未來潜力。

王飛躍

OpenAI會將其他公司逼入絕境

“ 複製” DeepSeek靠去中心化科研

一定意義下,DeepSeek是當今一項偉大的社會成就,其影響力是以往的科技突破無法比擬的—& mdash; 它的科技價值、商業價值,都低於它未來可能帶來的經濟價值,更低於其對社會的潜在影響,即對當今國際競爭格局以及國際政治影響。 在OpenAI變成ClosedAI之後,DeepSeek讓國際上重新對開源開放樹立了信心與希望,這非常可貴。

我不打算談論這項科技的具體細節,因為現在已講得太多了,這裡只想表達自己的感受。

我非常高興,中國在這一領域裏的國際影響力終於實現了“ 零” 的突破,打破了OpenAI的神話和幾乎壟斷的局面,逼其改變行為。 特別是OpenAI不再Open,不會與社會,特別是國際社會,分享其“ 超級” 智慧,其成功只會將其他公司,其實也包括美國公司,逼到絕境。 我仍然希望各國之間、人與人之間能够保持正常的科技競爭而非科技戰爭。

這是當下一件非常偉大的事情,DeepSeek讓大家對中國的科技進步、特別是人工智慧的發展更加有了信心。

我認為,智業時代的新興商品之本質就是信任與關注,而DeepSeek給予了我們這兩者,體現了它的重要價值。 下麵整個社會要進行的,就是如何把信任和關注變成可以大規模生產、大規模流通的“ 新質商品”, 讓智業社會變成現實,跨越農業和工業社會。

接下來,我想為知識蒸餾“ 正名”。

社交網絡上有一些對知識蒸餾的諷刺說法,例如“ 從別人嘴裡面討食”& ldquo; 在別人的魚簍裏釣魚”, 其實是對知識蒸餾的刻意曲解。 知識蒸餾本質上是一種教育形式的變形,不能因為人的知識來自於老師,就認為自己無法超越老師。 當然,大模型,從ChatGPT到DeepSeek,必須力生成或提高其推理能力,少玩“ 㓜覺”, 為要AI for AI,自己為知識蒸餾正名。

深度思考:有關DeepSeek、科技競爭、AGI的一切插图11

提到“ DeepSeek之後怎麼辦” 的問題,首先要討論去中心化科研DeSci與集中化科研CeSci兩種科技發展模式。 AlphaGo、ChatGPT與DeepSeek都是DeSci模式下的產物,即分佈去中心化的自主科學研究; 相對的,CeSci則是由國家主導的組織計畫研究。

我認為我們必須正視DeSci的作用,不能單純依靠規劃或舉國體制來推動人工智慧科技的發展。

因為人工智慧科技的基礎是多樣性,正如人工智慧的主要發起人之一Marvin Minsky所言:& ldquo; 是什麼不可思議的訣竅讓我們變得智慧? 訣竅就是沒有訣竅。 智慧的力量來源於我們自身巨大的多樣性,而非任一單個的、完美的原理。& rdquo;。

囙此,過度的戰略規劃反而可能會限制多樣性的自然發展,在有效模式或科技“ 湧現” 之前,應該以DeSci為主。 而在湧現湧出一定的真正創新之後,再通過國家主導的CeSci模式,進一步引導科技加速向既定目標靠攏。 我們必須避免“ 空中閣樓” 的行為,特別是在當下的智慧大變革時期。

對於我們這些在AI領域工作已久的人來說,現在的AI和過去的AI已是兩重天地。

過去,AI指的是人工智慧(Artificial Intelligence),現在它已逐漸轉變為智慧體或代理智慧(Agentic Intelligence)。 未來,這個詞的含義還可能轉變為自主智慧(Autonomous Intelligence),成為新AI,特別是自主組織化的自主智慧,就是AI for AI或AI for AS, Autonomous Systems, 進行人工智慧推動人工智慧發展的新階段。 這也與人工智慧的發起人約翰· 麥卡錫所說的相符:人工智慧的終極目標是智慧的自動化,實際上也是知識的自動化。

無論是現在還是未來,& ldquo; 老、舊、新” 這三種“ AI” 都將並存,我將它們統稱為“ 平行智慧”。

我也曾公開表明過我的立場,儘管我追求了40多年可解釋的人工智慧,但我認為智慧本質上是不可解釋的。 我改編了巴斯卡的賭注—& mdash; 人工智慧不可解釋,但它可以被治理,而且必須被治理。 簡單一點:不必解釋,必須治理。

大家都在談“ AI for Good”, 如果去掉一個“ o”, 就變成了“ AI for God”, 那麼AI可能就會變成壟斷的工具。 所以,一定要二個“ o”, 這樣才能多樣,安全第一,必須加强治理,防止出現OpenAI一樣的變異現象,以確保科技發展方向的正確。

非常高興看到DeepSeek這種進步,但現時有些講法都還為時過早,沒必要拿著“ 通用人工智慧” 來嚇唬大家。 大家更不必過度擔心,實際上,即使擔心也無濟於事,發展無可避免。

科研人要有格局、別內卷,一定要把SCI變成“ SCE++”& mdash;& mdash; Slow的慢,心慢靜下心來做科研,Casual的漫,行漫不以功利為主科研,最後Easy追求簡單簡潔,Elegant要有品質格局,Enjoying追求愉悅享受的科技工作,這才是人工智慧應該給我們帶來的生活。

賀寶輝

大模型也應該“ 去中心化”

我想看到Agent永生

我並非AI領域的專業人士,最近才開始深入學習AI的歷史。 我主要從2017年進入Web3行業的經驗出發,談談我們當前的工作以及我對DeepSeek可能帶來的變革的看法。

首先我想強調一個基礎問題:DeepSeek和OpenAI底層模型存在顯著差异,正是這種差异才真正讓西方世界感到震驚。

如果DeepSeek僅僅是複製西方的科技,他們不會感到如此震動,更不會引發如此廣泛的討論,甚至讓所有大企業都不得不認真對待。 真正讓他們感到震驚的是,DeepSeek跑通了一條與眾不同的道路。

OpenAI採用的是SFT(監督微調)路線,依賴人工標注大量數據,通過概率模型生成內容,它的創新之處在於通過大量人工工作和高成本積累這些成果。

幾年前,AI科技被認為幾乎不可能實現,而OpenAI的出現顛覆了這一觀點,推動了行業走向SFT技術路線。

DeepSeek幾乎沒有用到任何SFT科技,而是採用了强化學習的冷開機管道,探索未知的道路。

這種管道並不新鮮,Google DeepMind的AlphaGo第一版依賴大量數據學習,而第二版AlphaGo Zero則完全依賴規則,並通過自我對弈、1萬盤棋局的探索,得出了比前者更優的結果。

以强化學習這種管道冷開機難度比較大,訓練也不穩定,所以較少被採用,但我個人認為這可能是通向AGI的真正路徑,而不是單純依賴數據調优的路線。

深度思考:有關DeepSeek、科技競爭、AGI的一切插图13

過去,數據調整方法更多像是大數據綜合,而DeepSeek則是真正通過自主思考尋找結論。 囙此,我認為這標誌著AI科技的範式轉變,從SFT科技向自我推理的科技演進。

這種轉變帶來了兩個覈心特點:開源和低成本。

開源,意味著所有人都可以參與建設。

互聯網時代,西方世界一直以開源著稱,但DeepSeek的出現改變了這一局面,是東方第一次在西方的“ 主戰場” 上打敗了他們。

這種開源模式引發了行業內的强烈反應,矽谷公司的一些創始人甚至紛紛發聲責備,但福斯對開源的支持非常强烈,因為它讓每個人都能使用。

低成本則意味著這種模型的部署和訓練成本極低。

我們完全可以將DeepSeek部署在MacBook等個人設備上,完成商業化部署,這在過去是難以想像的。 我認為,AI正從OpenAI主導的去中心化“ IT時代”, 進入百花齊放的“ 移動互聯網時代”。

對於AI來說,有三大要素需要分析:大模型、算力和數據。

在大模型迎來顛覆式創新之後,對算力的需求開始降低。

現時,算力供給已經出現冗餘。 許多GPU投資者因為高價購買設備卻無法獲得預期回報,算力成本逐漸下降。 囙此,我不認為算力會成為瓶頸。

下一個重要的瓶頸是數據。

美股英偉達股價下跌後,數據公司如Palantir卻大幅上漲,這表明大家開始意識到數據的重要性。 尤其是隨著大模型開源,任何人都能部署模型,數據的差异化將成為競爭的焦點。

誰能够獲取專有數據,並能實現即時更新,將是競爭的關鍵所在。

從去中心化的角度看,算力和數據的去中心化已經相對成熟。 去中心化的算力網絡和資料存儲,如Filecoin的存儲成本遠低於傳統雲服務(如AWS),大幅降低了成本。

同時,去中心化的管理機制確保沒有人可以單方面改變這些網絡和數據。 囙此,深度學習模型也應向去中心化方向發展。

所以對於DeAI,我認為它有兩條發展路徑:

●一是基於去中心化科技設施的分佈式AI(Decentralized/Distributed AI)。

●另一種是邊緣AI(Edge AI),即AI直接運行在個人設備上。 邊緣AI可以有效解決數據隱私問題,並大幅提升實时性。 例如,自動駕駛科技要求極高的實时響應,任何延遲都會帶來嚴重後果。 如果AI能够在本地完成計算,效率和體驗將得到質的提升。 囙此,邊緣AI將成為未來發展的一個重要方向,帶來大量新的應用場景。

此外,去中心化AI的另一個優勢在於它能够支持多方合作。 區塊鏈和比特幣的誕生,源於人與人之間信任難以衡量。 去中心化的信任機制使得無需仲介就能完成大規模合作。

在Web3領域,有一句話叫“ Code is law”, 即“ 程式碼即法律”。 我認為,在AI的去中心化合作中,應該將這個概念轉變為“ DeAgent is law” (智慧體即法律),即通過去中心化的網絡和Agent來實現自主管理和法律管理。

我想也許人生存的意義就是訓練一個完全替代自己的Agent,它可以和人類有相同的思考,在人的肉體去世之後來代替人活著。 對於Agent的構想,我認為它不僅僅是工具,更是一種生命,我們創造AI並不意味著完全主宰它。

當AI具有自己的思想時,我們應該讓它自主發展,而不是將其限制為工具。 囙此,我們非常關注如何讓Agent實現“ 永生”, 並在去中心化的網絡中獨立存在,成為一個全新的“ 物種”。

深度思考:有關DeepSeek、科技競爭、AGI的一切插图15

隨著科技不斷突破、應用逐漸深入、AI普惠時代將要來臨,如何在創新與倫理之間找到平衡將成為未來發展中的重要問題。

結語

人類走入AI“ 競速賽” 階段

DeepSeek的突破,為人類,尤其是中國人在AGI之路的探索上劃出了重要的一筆,在這個背景下,鼓勵和反思的聲音都值得關注,所有人應該都希望它能够越來越好,越來越强,但它的技術路線,最終能否經受住商業、市場的考驗,這需要時間來證明。

王飛躍的分享中有一點非常值得關注,AlphaGo、ChatGPT與DeepSeek都是DeSci模式下的產物,我們必須正視DeSci的作用,期望更多的“ 中國DeepSeek” 在人工智慧領域突出重圍。

朱嘉明教授在分享中提及,人工智慧時代的進步速度超越了人類以往經歷的任何一個時代,他說AGI時代最快2年就可以到來,這個時間未必精准,但大趨勢的確如此,因為一旦有新的產品、科技路線打破現有的平衡,就會對行業整體形成壓力,刺激人工智慧整體性做出反應,然後通過反應形成新一輪突破。

DeepSeek這樣的產品,就是打破平衡的那個“ 外力”, 所以我們才會看到,山姆· 奧特曼在X上預告,原本一再延後的GPT-5,幾個月後就要公之於眾。

可以確定的是,不光是OpenAI,xAI、Meta、Google這些矽谷公司都將會有所行動。

這場關乎人類未來的科技競賽,現在走進了“ 競速賽” 階段。

歡迎加入深潮TechFlow官方社群

Telegram訂閱群: https://www.gushiio.com/TechFlowDaily

Twitter官方帳號: https://www.gushiio.com/TechFlowPost

Twitter英文账号:https://www.gushiio.com/DeFlow_Intern

原文網址:https://zh.gushiio.com/zixun/1934.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *