十篇ai agent研報,看懂2025年全球智能體行業全景
文|王吉偉
差不多每個春節前後,科技界都會有些“大事件”發生,尤其是這幾年日新月異的ai領域。
往年都是國外產品吸引眼球,而今年換成了中國技術驚艷全球。
春節前幻方量化發布的大模型deepseek-r1,一經亮相便迅速炸場ai領域,全球的企業管理者、創業者、項目經理、分析師乃至相關部門領導人都現身說法,感慨deepseek-r1在大模型領域取得的突破性進展。
deepseek-r1在後訓練階段採用了大規模強化學習技術,使得在標註數據極少的情況下,依然能實現顯著提升推理能力。這一技術的進步使它在數學、代碼及自然語言推理等多項任務中,表現出可與openai的最新版本相媲美的性能,真正實現了開源化。這意味著,ai領域正在朝著“低成本+高性能”方向邁進。
重要的是,基於deepseek-r1的browser-use 等很多智能體實操案例已經證明,deepseek能夠有效降低部署ai agent的門檻,能夠大幅提升ai agent性能和效率,增強場景適應能力。
在llm based ai agent亟待落地的當下,一個高效且性價比可觀的大模型對於智能體的重要性可想而知。可以預見,接下來deepseek-r1等強化學習類大模型,將會極大地提升智能體的構建與應用效率,進一步加速ai agent的落地應用。
當然,在智能體成為ai應用主旋律的當下,春節前後更精彩的仍然是ai agent行業,產品研發與生態擴建方面全球技術廠商都在馬不停蹄。
谷歌於 2024 年 12 月發布了全新多模態大模型gemini 2.0,其性能全面提升,支持圖片、視頻和音頻等多模態輸入與輸出。基於gemini 2.0架構,谷歌推出了三個新的ai智能體原型:通用大模型助手project astra、瀏覽器助手project mariner和編程助手jules。其中,編程助手jules能夠直接集成到github的工作流程系統中,分析複雜代碼庫並實施修復。
微軟於2024年10月宣布在dynamics 365中集成10個自主ai agent,這些智能體能夠自動執行客服、銷售、財務、倉儲等業務流程。這些ai agent支持 openai的o1模型,具備自主學習能力,可以自動執行跨平台的超複雜業務。例如,美國著名電信公司lumen通過ai agent每年能節省5000萬美金成本,相當於增加了 187 名全職勞動力。
openai在2025年1月24日發布了其首款ai agent—— operator,該系統能夠自動執行各種複雜操作,包括編寫代碼、預訂旅行、自動電商購物等。2月2日正式推出面向深度研究領域的智能體產品深度研究(deep research)功能。該功能可在5-30分鐘完成專業報告,支持多領域高強度知識工作者,由o3模型提供支持,通過端到端強化學習訓練,由四模塊協同工作,已在chatgpt上線,未來計劃擴展數據源和結合operator執行複雜任務。
anthropic於2025 年 1 月發布了agent最佳實踐指南,旨在提升ai agent在多個應用場景下的效率和靈活性。還計劃在2025年推出智能體“ai同事”(virtual collaborator),能夠編寫和測試代碼。其旗艦產品claude 3.5 sonnet升級版在osworld測試中電腦使用能力得分為ai模型中首位。
在國內,阿里雲通義千問也於1月29日上線了超大規模的moe模型qwen2.5-max。該模型預訓練數據超過20萬億tokens,在多個基準測試中表現優異,整體性能優於deepseek v3。
通義千問還開源了全新的視覺模型qwen2.5-vl,推出3b、7b和72b三個尺寸版本。qwen2.5-vl和2.5max不僅在性能上取得了顯著提升,而且在ai agent尤其是computer use方面展現出了強大的應用潛力。例如,qwen2.5-vl能夠直接作為視覺agent進行操作,推理並動態使用工具,支持在計算機和手機上完成多步驟的複雜任務,例如自動查詢天氣、預訂機票、發送消息等。
各大科技公司都在用快速疊代的產品與解決方案,對外彰顯其在ai agent領域發展的絕對速度。從目前各領域的表現來看,2025年這個ai agent商業化應用元年,智能體的落地應用比大家想像的要快得多,預示著ai agent技術即將迎來爆發式增長,當然競爭也更為激烈。
這種情況下,自然會有很多朋友想要快速認知與掌握ai agent。而了解一個行業最快的方式,莫過於先從閱讀各種各種行業研報資料開始。
為了幫助大家更好地了解、學習與應用ai agent,在2025年春節假期歸來開工的第一天,王吉偉頻道精心準備了10份智能體行業研報。
這些研報涵蓋了ai agent的最新技術進展、應用場景、行業趨勢以及面臨的挑戰等多個方面,旨在為大家提供全面、深入的參考。無論是企業決策者、技術開發者還是對ai agent感興趣的讀者,都可以從這些研報中獲取有價值的信息,把握ai agent帶來的發展機遇。
報告1:谷歌《agents》白皮書
該白皮書探討了生成式人工智慧(generative ai)模型如何通過使用外部工具來擴展其功能,從而形成所謂的agents(智能體)。詳細居間了agents的定義、認知架構、關鍵組件、工具使用、以及如何通過這些工具和架構來增強模型性能和實現生產應用。
它首先闡明了agent區別於單純模型的關鍵在於其能夠利用工具訪問外部信息,並進行自主推理和行動規劃,而非僅僅依賴訓練數據進行單次預測。
白皮書詳細居間了agent的三個核心組成部分:模型(language model)、工具(extensions, functions, data stores)和編排層(orchestration layer)。編排層利用各種推理框架(如react, chain-of-thought, tree-of-thoughts)指導agent的決策過程。工具則賦予agent與外部世界交互的能力:extensions連接agent與api,functions允許客戶端控制api調用,data stores則提供對外部數據的訪問,支持rag等應用。
最後居間了在langchain和vertex ai平台上構建和部署agent的方法,並討論了如何通過各種學習方法(如上下文學習、基於檢索的上下文學習和微調)提升模型性能。總而言之,該白皮書旨在系統性地講解生成式ai agent的原理、架構和應用實踐,為開發者提供構建更強大、更靈活的ai系統的指導。
對於希望了解或構建agents系統的朋友來說,是一份非常有價值的資源,推薦詳細研讀。
報告2:anthropic《building effective agents》
《building effective agents》深入探討了構建大型語言模型(llm)agent的實踐經驗與洞見。文章開篇對“agent”一詞進行了明確界定,並細緻區分了工作流(workflow)與agent在架構上的不同之處。
工作流指的是對llm和工具的預定義流程進行編排,而agent則賦予了llm動態調控其流程及工具使用的靈活性。還分析了在何種情境下以及如何有效運用agent系統,並著重指出,在應用構建過程中,應優先採用最簡潔的方案,並根據實際需求逐步引入複雜功能。
文章深入探討了幾種構建agent的常見模式,包括增強型llm、提示鏈(prompt chaining)、路由(routing)、並行化(parallelization)、指揮者-工作者(orchestrator-workers)和評估器-優化器(evaluator-optimizer)等,並強調了簡潔性、透明度和周全的工具文檔和測試的重要性。
這些模式旨在指導開發者構建高效、可靠且易於維護的agent系統,而非追求過度複雜的系統。文章還提供了在客戶支持和編碼領域使用agent的實際案例,並附錄中詳細說明了工具的提示工程技巧,以幫助開發者創建更有效的agent-計算機接口 (aci)。
《building effective agents》報告能夠為對ai agent感興趣的讀者提供了全面且實用的指導。它不僅解釋了ai agent的核心概念和構建方法,還通過實際案例和建議,幫助讀者更好地理解和應用這些技術。對於希望深入了解和構建llm agent的讀者來說,這份報告是一份不可多得的參考資料。
報告3:langchain《state of ai agents》
報告通過調查超過1300名專業人士,揭示了2024年ai agent的使用現狀,包括它們在不同行業中的應用情況、主要用途、面臨的挑戰以及未來的發展趨勢。
該報告將ai agent的定義為使用大型語言模型(llm)來決定應用程式控制流的系統。探討了了不同類型的agent框架,如react、多agent編排器和langgraph等,這些框架在業界獲得了廣泛的關注。提到了ai agent在不同行業中的應用,以及它們在處理研究、總結、個人生產力任務、客戶服務等方面的具體用途。
報告發現,超過一半的受訪者正在生產環境中使用人工智慧agent,而絕大多數受訪者計劃在不久的將來部署ai agent。主要的應用案例包括信息研究和總結以及提高個人生產力,而客戶服務也是一個重要的領域。報告強調了追蹤和可觀察性工具以及人工監督在控制ai agent風險方面的重要性,並指出性能質量是部署ai agent的最大障礙。
最後,報告分析了cursor、perplexity和replit等成功的案例,並探討了多步驟任務管理、重複性任務自動化以及ai agent的協作等新興主題。報告調查顯示,不同規模的公司在ai agent的控制和優先事項方面存在差異,大型企業更注重安全性和合規性,而小型公司更關注追蹤和理解結果。
《langchain ai agent 狀態報告》提供了關於ai agent現狀的全面概述,並深入探討了其應用場景、挑戰和未來趨勢。對於希望了解ai agent技術並在實際中部署相關應用的讀者來說,具有很高的參考價值。
報告4:langbase 《2024 state of ai agents》
langbase research《 state of ai agents》基於3400多位來自100多個國家的開發者的反饋,總結了ai智能體領域的最新趨勢。報告描繪了ai技術在2024年的新高峰,以及開發者如何利用不同大型語言模型(llm)提供商構建ai agent,並探討了在工作流程中採用ai agent所面臨的挑戰和目標。
研究旨在了解ai agent在2024年的發展情況,包括開發者如何使用不同的llm提供商服務,以及在實際應用中遇到的挑戰和目標。研究還探討了ai在不同行業和公司規模中的應用情況,以及開發者對於ai開發平台的偏好。
報告揭示了openai在llm提供商中占據主導地位,但google和anthropic緊隨其後;不同llm提供商在不同行業應用中各有優勢。可擴展性複雜性和數據隱私是阻礙ai智能體廣泛應用的兩大主要因素,而準確性是開發者選擇llm時的首要考慮因素。
報告還指出,自動化和簡化是企業採用ai技術的首要目標,軟體開發是llm最主要的應用領域。最後,報告強調了開發者對可定製的ai開發平台和工具的需求,以及對版本控制和sdk生態系統的重視。
對於希望了解ai agent技術的讀者來說,這是一份非常有價值的參考資料,可以幫助大家更好地了解市場動態和技術發展方向。
報告5:insight partners 《the state of the ai agents ecosystem: the tech, use cases, and economics》
這份insight partners撰寫的報告探討了ai agent生態系統的現狀、應用案例和經濟模式。基於對構建者、企業和研究人員的訪談,分析了ai agent在企業架構中的實際部署情況,討論了不同使用案例的複雜性、購買特定功能agent與構建自定義agent工作流之間的權衡,以及價值衡量和歸屬的多樣性
報告首先定義了ai agent,並闡述了其架構設計中的關鍵考量,特別是人機協同循環和任務規劃策略。接著,報告深入分析了ai agent的參考架構,包括數據檢索(rag、記憶、長上下文)、agent計算機接口(函數/工具調用、計算機使用、集成)以及性能評估和安全防護(guardrails)。
報告對ai agent進行了類型劃分,包括垂直agent、水平agent平台、多模態agent和經典saas的agent接口。報告還繪製了ai agent市場圖譜,指出了基礎設施和垂直化平台的機遇,並探討了構建與購買ai agent的決策考量,以及新興的定價模式(平台+僱傭agent、平台+結果導向定價、純結果導向定價)。
最後,報告總結了企業和構建者在ai agent部署和發展中面臨的挑戰和最佳實踐,強調了合規性、數據準備、可靠性、roi衡量、文化融合等重要方面。
報告認為,ai agent的研究難點在於理解ai agent的複雜性,包括它們如何獨立推理和行動,以及如何將它們集成到現有的企業系統中。研究者需要評估不同使用案例的複雜性,並確定在購買特定功能agent與構建自定義agent工作流之間的最佳權衡點。衡量和歸屬價值的多樣性也是一大挑戰,因為不同的企業可能有不同的評價標準和業務目標。
這份報告旨在為企業和ai agent構建者提供對ai agent生態系統全面而深入的理解,並為其發展戰略提供指導。不僅分析了 ai agent 的技術細節,還深入探討了企業在部署 ai agent 時需要考慮的實際問題,並為構建者提供了有價值的建議,推薦仔細研讀。
報告6:infoq《中國 al agent應用研究報告》
infoq研究中⼼發布的《2024年中國ai agent應用研究報告》,深入分析了ai agent在中國的市場發展背景、特徵、應用案例以及未來趨勢。報告基於技術專利數量、技術發展時間、技術輿論指數等指標,結合市場規模與融資事件等資料,繪製了2024年中國ai agent應用的成熟度模型,並探討了ai agent在不同領域的應用現狀與未來發展方向。
報告聚焦2024年第二季度中國ai agent應用的研究。報告首先分析了ai agent市場的背景和特徵,以及當下中國人工智慧的技術成熟度模型,其中特別強調了ai agent作為連接大模型和應用層的橋樑作用。
報告深入探討了ai agent的市場趨勢,包括單/多智能體協同發展、通用技術框架、典型應用場景(生活類、企業專業類)以及不同廠商的產品策略(大模型創業廠商、網際網路科技廠商、rpa廠商、數位化企業服務商)。還展望了ai agent未來的發展趨勢,例如大模型能力提升、工具生態完善、多智能體協同,以及終端智能體(手機、電腦等)的興起將帶來的變革。
報告指出,ai agent作為連接模型層與應用層的重要補充,正逐漸深入複雜任務,並在多個行業場景中展現出應用潛力。報告基於技術專利數量、技術發展時間、技術輿論指數等核心指標,結合市場規模與融資事件等公開資料,以及技術和市場專家的驗證,繪製了中國人工智慧成熟度模型,並對ai agent的市場特徵、應用場景、產品發展、盈利模式等進行了詳細探討。
《2024年中國ai agent應用研究報告》是一份極具前瞻性和深度的研究報告,對於關注人工智慧技術發展、尤其是ai agent應用的從業者、企業決策者、技術愛好者以及相關領域的研究人員來說,具有很高的參考價值。
報告7:愛分析《2024愛分析·ai agent 應用實踐報告》
《2024愛分析·ai agent 應用實踐報告》由愛分析撰寫,旨在探討ai agent在企業中的應用現狀、市場洞察以及未來發展趨勢。
報告首先概述了ai agent的核心能力——獨立思考、自主執行、持續疊代,以及其在市場中的興起和企業落地的主要挑戰:“落地難”和“應用難”。
核心內容聚焦於數據分析ai agent和ai agent開發管理平台這兩個特定市場,分別分析了其落地實施的關鍵要點和成功案例,例如城商行利用數據分析ai agent提升數據分析效率,飛鶴利用ai agent開發管理平台推進數位化轉型。
報告指出,ai agent作為能夠感知環境、基於目標進行決策並執行動作的智能化應用,隨著大模型能力的增強和相關技術的成熟,其能力得到了質的飛躍。報告強調了ai agent在企業中的三個核心能力:獨立思考、自主執行、持續疊代,並分析了企業在落地ai agent項目時面臨的挑戰。
報告還特別關注了數據分析ai agent市場和ai agent開發管理平台市場,提供了市場洞察和案例分析,為企業提供策略指導和實踐洞見。
該報告不僅分析了ai agent的技術和應用,更深入探討了企業在落地ai agent時面臨的挑戰和應對策略。報告強調了企業應從自身特性出發,建立ai agent與新質生產力、數據要素的內在聯繫,實現價值升華,並建立ai文化。該報告適合企業決策者、it負責人以及對ai agent應用感興趣的讀者閱讀。
報告8:頭豹研究《2024年中國ai agent行業研究》
《2024年中國ai agent行業研究:智能體落地千行百業,引領智能化革命的新引擎》報告,由頭豹研究院發布,深入分析了ai agent(人工智慧體)在中國的發展現狀、應用前景、市場趨勢以及行業生態。
報告首先定義了ai agent,並將其與大模型區分開來,強調其自主決策和執行能力;然後,分析了ai agent的關鍵特徵、分類及發展歷程,並對國內外主流項目及產品進行了盤點;接著,報告探討了ai agent的市場規模、驅動因素及行業生態圖譜,指出其在企業級應用(tob)方面擁有更廣闊的前景;最後,報告對ai agent在不同行業領域的應用情況及發展趨勢進行了深入分析,並對未來發展方向進行了預測,特別指出金融行業是ai agent應用最成熟的領域,而政務領域則由於數據獲取的限制,發展相對滯後。總而言之,該報告旨在為投資者、企業和研究人員提供對中國ai agent行業全面而深入的了解。
報告指出,ai agent作為一種能夠感知環境、進行決策和執行動作的智能實體,與傳統人工智慧相比,具備更強的自主性和適應性。詳細居間了ai agent的定義、基礎架構、特徵分類、發展歷程、市場驅動因素、行業應用圖譜、商業模式以及消費級與企業級應用的對比。
還預測了ai agent在不同行業中的應用發展情況,並提供了國內外ai agent項目及產品的盤點。整體而言,ai agent在企業級應用中前景廣闊,尤其在金融、電商零售、教育、醫療、製造、交通、媒體娛樂、能源、物流和政務等行業領域中展現出強大的滲透力和應用潛力。
該報告不僅指出了ai agent在金融等領域的成熟應用,也探討了其在其他行業的潛力,為對ai agent技術和市場感興趣的讀者提供了有價值的參考。該報告適合希望了解ai agent如何落地並引領行業變革的讀者閱讀。
報告9:letta 《the ai agents stack 》
報告探討了2024年末ai智能體(agent)的軟體生態系統,並提出了作者自己基於多年經驗的“智能體堆棧”模型。
該模型將智能體系統分為三層:底層是大型語言模型(llm)及其服務和存儲,包括各種api服務和向量資料庫;中間層是智能體框架,負責llm調用、狀態管理、內存管理以及多智能體通信;頂層是智能體託管和服務,關注如何將智能體部署為服務,並通過rest apis訪問。
報告強調,與簡單的llm聊天機器人相比,智能體開發面臨著更大的工程挑戰,例如狀態管理和工具執行。作者認為,未來的智能體將作為服務部署,並期待出現類似於openai chatcompletion api的行業標準智能體api。
報告還提到了2022年和2023年興起的llm框架和sdk,如langchain和llamaindex,以及通過api消費llm的標準平台,如vllm和ollama。同時,文章也指出了2024年ai領域對“agents”概念的轉變,以及如何從llm發展到ai agent的必要性。
這份報告主要面向軟體開發者,旨在幫助他們理解 ai agent 技術棧的複雜性,並為他們提供構建垂直 agent 應用的指導。報告強調了 ai agent 與傳統 llm 聊天機器人在工程方面的不同,並居間了 letta 提供的相關資源。該報告適合對 ai agent 技術棧和實際應用感興趣的開發者閱讀。
報告10:德勤《prompting for action how ai agents are reshaping the future of work》
該報告由德勤(deloitte)人工智慧研究所發布,探討了ai智能體和多智能體系統如何重塑未來工作。重點居間了生成式ai(genai)的擴展能力和多智能體 ai系統的協同作用,以及這些技術如何影響企業並推動智能組織轉型。
報告圍繞“隨著ai技術的快速發展,企業如何利用ai agent和多agent ai系統來重塑業務流程,提高效率並實現自動化”這一問題,展開了詳細討論。
報告指出,ai智能體與傳統語言模型不同,具備推理、規劃、記憶和行動能力,能自動化工作流程。多智能體系統通過協同合作提高效率、學習能力和準確性,處理複雜任務。例如,在戰略洞察方面的應用展示了其在速度、效率和可擴展性方面的優勢。還探討了ai智能體對戰略、風險、人才和業務流程的影響,並建議領導者評估用例、制定戰略路線圖、投資基礎設施和人才培養以及加強數據治理和風險管理。
報告提到了當前企業廣泛使用的大型語言模型(llms)和genai工具,這些工具雖然能夠根據簡單提示生成輸出,但其交互通常是事務性的,且作用範圍有限。探討了ai agent與傳統語言模型的不同之處,以及ai agent如何通過理解上下文、規劃工作流程、連接外部工具和數據以及執行動作來實現目標,從而克服了傳統ai應用的局限性。
報告認為,如何克服傳統ai應用在理解複雜請求、規劃工作流程和執行多步驟任務方面的局限性,以及如何整合不同ai agent以實現更高級別的自動化和優化,是需要關注的重點問題。
總體而言,該報告強調ai agent和多智能體系統在推動智能化轉型方面的潛力,並指出前瞻性的企業和政府機構已經開始部署這些技術,適合對ai agent的最新進展及其在各行業的實際應用感興趣的讀者閱讀。
原文網址:https://zh.gushiio.com/ai/365.html