2025,ai agent還在起跑線
文|新眸,作者|李小東
當2024年全球科技峰會的話題從“大模型參數競賽”轉向“智能體落地場景”時,行業似乎完成了一次集體認知躍遷。人們意識到,ai的價值不再是參數量的天文數字,而在於能否像水一樣滲入真實世界的縫隙。
過去兩年,隨著混合專家架構(moe)、神經符號系統等技術範式的疊代:智能體不再依賴“暴力訓練”,而是通過知識注入與邏輯推理的結合,逐步逼近人類專業能力。& nbsp;全球科技巨頭與初創公司紛紛將資源投向ai agent,人們甚至開始產生一種錯覺——智能體很快會進入成熟期。
這種感覺的背後,源於行業對“智能體”定義的微妙重構。相比馬文·明斯基時代的“自主生命體”理想,在大模型取得突破性進展的當下,留給ai應用落地窗口期愈發緊迫,對智能體的界定,雖然同樣具備能夠 “自主感知並採取相應行動” 的特徵,但更多是把它視作ai應用落地最重要的一種產品形態。
從anthropic、google deepmind到openai,從字節、百度等頭部大廠,到kimi、智譜等ai新勢力,各家公司都在探討如何利用這項技術去顛覆現有的行業格局,讓智能體真正成為打通ai從實驗室到實際場景落地的利器。
然而看似繁榮的落地案例,大多僅是技術長跑中的零星里程碑:特斯拉optimus機器人能分揀零件,但面對傳送帶突發卡頓仍需要人類救場;anthropic的computer use讓用戶可以指揮claude操作電腦,但面對複雜流程,也只有15%的操作成功率。
這些情況並非個例。當前大多數智能體集中在高度結構化的環境中運行,而人類世界的複雜性遠超實驗室預設的邊界。站在2025年的節點,這個被賦予“顛覆生產力”使命的技術,仍處於爆發前夜。
篤信行業的人會認為,當大模型完成技術啟蒙,算力基建逐步完善,智能體正在打開一個比移動網際網路更龐大的市場——結合麥肯錫與gartner研究預測,到2027年,智能體將滲透至大部分的企業工作流,釋放萬億美金經濟價值。我們看到的不是技術天花板,而是一個領域新的起跑線,技術、商業與社會的碰撞剛剛開始,真正的變革將在混沌中重塑規則。
01 智能體爆發前夜
在很多人的印象里,ai智能體能夠實現工作流程的自動化,其實早在多年以前,就有企業已經開始嘗試使用基於規則的系統來處理簡單任務,比如一些系統可以根據預設的知識庫,自動回答客戶的基本問題。
最接近智能體形態的產品是ibm watson這類規則引擎驅動的專家系統和siri等單點交互工具,但這些依靠預設規則和簡單決策樹運行的相對初級的程式,局限性非常明顯:當面對複雜業務場景時,系統需要工程師編寫數以萬計的if-then規則,任何業務規則的細微調整都可能引發蝴蝶效應,導致整個系統需要推倒重來。
真正革命性的突破發生在2015年前後。隨著深度學習技術的發展,ai開始具備自主學習和環境適應能力。谷歌deepmind團隊的alphago就是典型的例子,在2016年擊敗圍棋世界冠軍,標誌著人工智慧從”機械執行者”向”策略制定者”的蛻變。
彼時的智能體,作為基於電腦程式和算法構建的智能實體,也逐漸具備了基於數據自我疊代的能力,但由於“算法泛化能力不足”與“場景理解碎片化”的技術局限性,還沒有達到完全自主決策的程度。alphago雖然在圍棋領域超越人類,卻無法將這種能力遷移至其他場景。這種專家系統式的智能,本質上仍是戴著鐐銬跳舞。
直到大模型的出現。
2020年gpt-3橫空出世,智能體進入了一個新的認知革命,體現在兩個方面:ai認知的泛化,千億參數構建的大模型能理解跨行業的術語與業務邏輯;人機互動方式的改變,人們可以通過對話來生成結果。
2022年底,chatgpt破圈,驗證了大模型作為“通用認知引擎”的可能性,次年多模態大模型爆發,被視為智能體的“成人禮”,gpt-4、gemini等模型展現的跨模態能力,讓智能體初步具備人類的多感官協同。
在這樣的背景下,具備持續學習能力的ai agent,在一定程度上有望突破工具屬性,成為具備商業思維的”數字員工”,也就是大家現在所理解的“企業智能助手”的雛形。
與此同時,大模型api調用成本從gpt-3的每千tokens 0.06美金,降至gpt-4 turbo的0.01美金,意味著中小企業也能負擔智能體部署。包括麥肯錫在內的多家研究機構測算並得出結論,大模型推動智能體部署成本下降60-80%。
智能低門檻、高適配、強進化的應用特徵,讓不少為了擺脫商業化困境的ai玩家,將智能體當作新的突破口。
而人們對智能體的終極期待,是構建一套“企業認知中樞”——它不僅是執行命令的工具,更是沉澱知識、優化流程、預測風險的核心引擎。這一願景在過往受限於技術碎片化與成本壁壘,而如今,大模型的泛化能力、多模態融合與成本下降,終於讓商業社會看到了破壁的機會。
02 行業現狀冰火兩重天
anthropic ceo dario amodei曾斷言,未來2~3年內,ai可能在幾乎所有任務上超越人類,五年內智能體將滲透90%的企業工作流。智能體之所以成為風口,本質是市場對“第二代數位化轉型”的豪賭,如果說2000-2020年實現了業務流程數位化,當下正進入“用智能體重構業務本質”的新階段。
根據cb insights,2023 年,全球ai初創公司融資總額達到425億美金。而伽馬數據則顯示,過去的一年裡,全球ai產業融資金額超4000億元,同比增長超77%,其中智能體相關的初創企業融資占比尤其顯著。
但資本市場的狂熱與產業實踐的謹慎形成微妙張力。綜合各類機構調研,2024年全球僅小部分智能體部署項目實現盈利,多數企業仍在為“如何讓ai理解業務邏輯”焦頭爛額。這種矛盾映射出一個現實:智能體從技術演示到商業閉環之間仍有巨大鴻溝。
從技術布局看,頭部公司的探索方向已現分野。
例如openai的sam altman押注“通用智能體”,試圖通過gpt構建可適應任意場景的認知引擎,剛剛正式發布的“operator”能讓智能體接管用戶電腦操作,例如自動編寫代碼並調試運行,但是否能避免此前anthropic computer use所暴露的控制能力脆弱性,還需要進一步驗證;
而微軟ceo納德拉選擇深度嵌入路線,將copilot植入office、teams等產品矩陣,試圖把智能體變成企業工作流的“隱形中樞”,但在供應鏈管理等複雜場景中,其智能體因缺乏行業知識庫支持,也曾引發過合規危機。
具體到智能體的商業化路徑,不同類型的公司也呈現出不同的思路:以openai、谷歌和字節跳動為首的平台基建型玩家,和以anthropic為代表的垂直深耕型選手。平台型與垂直型智能體公司的分野,本質上映射出技術普惠與深度價值的兩條進化路徑。
openai的gpts上線三個月即吸引超300萬開發者,用戶通過自然語言指令創建各種智能體,這種“對話即開發”的模式將生態擴張速度提升10倍,但繁榮背後暗藏隱憂——據similarweb監測,gpts商店中近70%的智能體生命周期不足30天,同質化工具泛濫導致用戶付費意願持續走低。
用生態化的平台來聚攏開發者,這種玩法在網際網路早期就已顯現,本質上是科技巨頭之間的軍備競賽。然而,平台型玩家雖占據流量與開發者優勢,卻難免廣度稀釋精度的悖論——當微軟copilot企業版用戶抱怨其生成的財務報告頻繁出現會計準則誤用時,openai工程師坦言“通用模型在專業場景的知識深度,不足人類專家的1/10”。
垂直型路徑則選擇向產業縱深處掘金,為了和openai等公司差異化競爭,anthropic在發布computer use之外,anthropic 把目光鎖定在金融、醫療等對合規審查、風險評估的要求極高的領域,以滿足這些剛需場景為切入點,提供“憲法ai”約束,用claude api滿足客戶的私有化部署。
不同於openai的“通用模型+生態擴張”,anthropic採用“可控性+行業適配”方案,這麼做的原因並非通過平台的形式來賣鏟子,而是在自身技術優勢的基礎上,滿足行業在ai時代對安全、精準、定製化服務日益增長的需求。
聚焦細分領域且能快速落地的方案,對於科創型公司來說更具實踐意義,國外ai科技公司langchain調查了從工程師、產品經理到商業領袖和高管共計1300多企業人士,調研的企業里,超過一半用agent來進行研究和總結的工作,其他依次為個人生產力工具、客戶服務、代碼生成等方面。
在過去的兩年裡,各類ai智能體產品,在全球各行各業釋放出極大的潛力。主打金融、法律文檔智能分析的hebbia.ai、為企業客戶定製ai客服的sierra,以及職業教育領域的sana labs等,都有不錯的增長。
資本的瘋狂湧入,推動這些新玩家們的融資規模與估值雙雙飆升。但與此同時,市場捲起的巨大泡沫,一些智能體初創公司的ps ratio(市銷率)甚至超過50倍,遠超此前saas行業平均水平。拿sierra來說,這家成立不到兩年的公司,估值已經達到45億美金,成為智能體初創企業中最火熱的投資標的之一。
垂直化也意味著規模天花板,gartner數據顯示,專注金融合規的智能體公司年均營收增速僅為平台型企業的1/3,且客戶獲取成本持續攀升,部分賽道已出現用80%資源爭奪20%頭部客戶的殘酷內卷。
從平台型到垂直型,兩種路徑的角力實則指向產業根本矛盾:通用智能體的開放生態能快速鋪量卻難挖深井,垂直解決方案雖能創造高毛利但複製成本陡增。
於是在這種情況下,一些公司已悄然調整戰略,anthropic 在claude api中開放“憲法規則自定義”接口,允許企業將內部合規條款植入模型,這種“可拆卸的垂直化”或許預示著未來智能體市場的終局形態:平台提供基礎認知引擎,垂直模塊則像app store中的專業應用般自由組合,最終在開放與封閉、普惠與深度的平衡中重塑商業。
但這些,還僅僅是一種預測。
03 智能體還在起跑線
兩者觀點看似矛盾,前者警示短期高估,後者強調長期革命性,但這些判斷的背後,其實都是對當下智能體技術瓶頸和商業化局限下的認知。
當前智能體的自然語言交互能力雖已突破語法層面,但在深層語義理解上仍存缺陷,在動態環境和跨系統的協作協作,智能體仍存在各式各樣的可靠性不足。在商業化層面,不少公司面臨成本和收益失衡,波士頓諮詢調研顯示,企業智能體項目中不到20%達到預期roi,多數企業仍在“試水”階段。
如果將視線放到國內,情況將會更加複雜。
事實上,國內和國外的智能體發展,一開始差異並不明顯,但現在差別越來越大。具體表現為,國外在智能體領域的融資規模不斷攀升,產品力不斷增強,部分超級公司正在崛起;而國內目前大多還停留在概念階段,這種情況和當年saas行業很相似。
從中國信通院發布的《2024年人工智慧發展報告》來看,在金融、醫療、製造等領域的智能體公司數量龐大,但受限於高部署成本和商業化落地難度,企業級市場的盈利項目占比屈指可數。
這一差距背後,是技術路徑、產業生態和商業邏輯的多重差異。
目前國外大部分智能體產品的交付,仍沿用軟體定製開發或按時訂閱的商業路徑,主要得益於其saas化基因,有成熟的軟體生態基礎,另一方面,智能體對傳統線下生產和運營流程的替代更加精細,可替代的人力環節更多,智能體能解決更多實際問題,因此擁有廣闊的發展空間。
商業發展的本質,是要縮短傳統流程,並儘可能降低成本,當成本比原來降低更多時,新的模式就會取代舊模式。但相比之下,國產ai的發展並非是因為軟體生態成熟,有了ai後如虎添翼;恰恰相反,國內軟體生態原本就不夠完善:既缺乏類似hugging face的模型庫、databricks的數據處理平台,行業內的api標準化也表現不足,增加了企業的集成成本。
這種情況導致在ai領域,國內還需要去彌補軟體生態方面缺失的功課。更棘手的是,企業客戶習慣為“功能模塊”付費,但拒絕為“決策能力”溢價。一些頭部廠商的智能體一旦報價超過客戶預期的範圍,客戶流失率甚至能達90%。
所以在2025年的節點,清醒認識到,伴隨ai從玩具編程工具,但如果要把智能體從生產力工具變成真正的生產力,這場變革還未抵達交卷的程度,它不會遵循摩爾定律的節奏躍進,而是要在試錯與疊代中蹣跚前行。
原文網址:https://zh.gushiio.com/ai/165.html