從 Manus 到 DeepSearcher,2025年最值得關(guān)注的十大 Agent 智能體架構(gòu)設(shè)計(jì) 原創(chuàng) 精華
2025年無(wú)疑是 Agent 智能體的元年。
這一判斷從 Deep Research 帶來(lái)搜索新范式,到 Manus 一夜爆火,再到 MCP 成為新的接口標(biāo)準(zhǔn),已經(jīng)被多次證實(shí)。
與普通 AI 工具相比,Agent 具有以下優(yōu)勢(shì):
- 更強(qiáng)的推理能力:基于多種推理模型,Agent 不僅執(zhí)行指令,還會(huì)深入思考問(wèn)題。
- 豐富的工具運(yùn)用能力:Agent 能夠幫助用戶連接 API 或控制硬件設(shè)備。
- 更強(qiáng)的信息檢索能力:通過(guò)與 LLM、向量數(shù)據(jù)庫(kù)以及 Embedding 模型等工具集成,Agent 能夠輕松處理海量數(shù)據(jù)集。
- 更完整的環(huán)境感知能力:Agent 能夠更充分地理解對(duì)話語(yǔ)境或物理世界中的情境。
Agent 的成熟,標(biāo)志著 AI 從簡(jiǎn)單給出答案到交付完整任務(wù)結(jié)果的進(jìn)化。那么,2025 年有哪些值得關(guān)注的 Agent 呢?
在這篇文章中,我們將詳細(xì)介紹2025年值得關(guān)注的10個(gè) Agent 智能體。
1、Deep Research 與 DeepSearcher:專業(yè)級(jí)報(bào)告生成
不久前,OpenAI 推出了深度內(nèi)容生成工具“DeepResearch”,用戶只需提出類(lèi)似“特斯拉的合理市值是多少”這樣的問(wèn)題,DeepResearch 就能生成一份涵蓋企業(yè)財(cái)務(wù)、業(yè)務(wù)增長(zhǎng)分析以及市值推演的專業(yè)報(bào)告。這無(wú)疑為搜索 AGI 的發(fā)展方向指明了道路。
在這樣的背景下,如何基于“DeepResearch”理念進(jìn)行定制化改造,成為了一個(gè)熱門(mén)話題。而 Zilliz 在這一領(lǐng)域也取得了顯著進(jìn)展,推出了 DeepSearcher 開(kāi)源項(xiàng)目,僅一個(gè)月時(shí)間,該項(xiàng)目在 GitHub 上的 Star 數(shù)量就接近 5000。
DeepSearcher 基于 DeepResearch 的大模型、超級(jí)搜索和研究助理的三合一架構(gòu),通過(guò) Milvus 向量數(shù)據(jù)庫(kù)引入本地?cái)?shù)據(jù),并支持用戶自由更換底層模型(如 DeepSeek-R1),為用戶帶來(lái)了更符合企業(yè)級(jí)場(chǎng)景的全新 RAG 范式。
從架構(gòu)上看,DeepSearcher 主要分為兩大模塊:
- 數(shù)據(jù)接入模塊:通過(guò) Milvus 向量數(shù)據(jù)庫(kù)接入各種第三方私有知識(shí)。這是 DeepSearcher 相比 OpenAI 原版 DeepResearch 的一大重大升級(jí),使其更適合擁有獨(dú)家數(shù)據(jù)的企業(yè)級(jí)場(chǎng)景。
- 在線推理查詢模塊:包括各種 Agent 策略和 RAG 的實(shí)現(xiàn)部分,負(fù)責(zé)為用戶提供準(zhǔn)確且有深度的回答。該模塊引入了動(dòng)態(tài)循環(huán)迭代機(jī)制:每次完成向量數(shù)據(jù)庫(kù)中的數(shù)據(jù)查詢后,系統(tǒng)會(huì)啟動(dòng)一個(gè)反饋(Reflection)流程。在每輪迭代結(jié)束時(shí),Agent 會(huì)對(duì)查詢到的知識(shí)進(jìn)行評(píng)估,判斷其是否足以解答初始問(wèn)題。如果存在知識(shí)缺口,則觸發(fā)下一輪迭代查詢;如果知識(shí)足夠,則生成最終報(bào)告。
2、Manus:一夜爆火的全能 Agent
Manus 是由創(chuàng)業(yè)公司 Monica 推出的一款 AI Agent,它被定位為全球首款通用 AI Agent。今年3月初一經(jīng)發(fā)布,便立刻引發(fā)了全網(wǎng)的熱議。根據(jù)官方展示的案例,Manus 能夠自主完成包括簡(jiǎn)歷篩選、房產(chǎn)研究、股票分析等多種類(lèi)型的復(fù)雜任務(wù)。它具備自主思考、規(guī)劃和執(zhí)行復(fù)雜任務(wù)的能力,并且能夠直接交付完整的成果。
官方披露的數(shù)據(jù)表明,Manus 在 GAIA 基準(zhǔn)測(cè)試中取得了 SOTA(State-of-the-Art)的成績(jī),超越了 OpenAI 等同層次的大模型。
Manus 的架構(gòu)設(shè)計(jì)可以表示為:Manus = LLM + Tools + Memory + Computer Use +Artifacts + 虛擬機(jī)
Manus 最核心的是 Computer User 技術(shù),這個(gè)技術(shù)的架構(gòu)設(shè)計(jì)如下所示:
3、Google Astra:重新定義日常生活中的 AI 助手
Google Astra 是由 DeepMind 開(kāi)發(fā)的一款 AI Agent,旨在通過(guò)多模態(tài)功能無(wú)縫融入日常生活。該 Agent 由 Gemini 2.0 驅(qū)動(dòng),能夠處理并響應(yīng)多種輸入信息,包括文本、圖像、視頻和音頻。
Astra 的主要特點(diǎn)包括:
- 實(shí)時(shí)記憶功能,能夠理解上下文;
- 先進(jìn)的工具使用能力,例如谷歌搜索、谷歌地圖和谷歌智能鏡頭;
- 協(xié)助完成諸如識(shí)別物體或提供推薦等任務(wù)。
例如,用戶可以將手機(jī)對(duì)準(zhǔn)書(shū)架,讓 Astra 識(shí)別評(píng)分最高的書(shū)籍,從而將數(shù)字世界和物理世界相連接。未來(lái),谷歌計(jì)劃將其部分功能集成到旗下其他產(chǎn)品中,Astra 有望在 2025 年重新定義個(gè)人 AI 助手。
4、微軟的 Copilot:簡(jiǎn)化工作流程并提高生產(chǎn)力
微軟的 Copilot 是一款集成在諸多微軟辦公平臺(tái)(例如 Office 365 和 Dynamics 365)中的 AI Agent,其目標(biāo)是簡(jiǎn)化日常任務(wù)與工作流程。以 Word 為例,Copilot 能夠協(xié)助用戶撰寫(xiě)報(bào)告或優(yōu)化已有文本;在 Excel 中,它可根據(jù)自然語(yǔ)言指令生成公式并創(chuàng)建可視化圖表;在 Teams 里,Copilot 可以總結(jié)會(huì)議要點(diǎn)、突出關(guān)鍵信息并提出后續(xù)行動(dòng)建議,從而提升協(xié)作效率。
對(duì)于開(kāi)發(fā)者來(lái)說(shuō),Copilot 的功能遠(yuǎn)不止于終端用戶的任務(wù)。它還提供與 Azure 的集成,助力實(shí)現(xiàn)工作流程自動(dòng)化和業(yè)務(wù)流程管理。通過(guò)將 AI 融入人們?nèi)粘J褂玫墓ぞ?,微軟?Copilot 讓重復(fù)性工作變得簡(jiǎn)單,使團(tuán)隊(duì)能夠?qū)⒕性诟咛魬?zhàn)性和創(chuàng)造性的任務(wù)上。
Copilot 的架構(gòu)設(shè)計(jì)如下圖所示:
5、ChatGPT Plugins 與 Operator:將 GPT 的能力拓展到現(xiàn)實(shí)世界任務(wù)中
ChatGPT 插件為 OpenAI 的 GPT 模型賦予了強(qiáng)大的交互能力,使其能夠與外部系統(tǒng)進(jìn)行溝通,從而執(zhí)行一系列現(xiàn)實(shí)世界中的任務(wù),而不僅僅局限于文本生成。通過(guò)與 Expedia、Wolfram Alpha 和 Zapier 等第三方服務(wù)的集成,這些插件讓 ChatGPT 能夠獲取實(shí)時(shí)數(shù)據(jù)并實(shí)現(xiàn)工作流程的自動(dòng)化,使其更接近于成為個(gè)人和企業(yè)的動(dòng)態(tài) AI 助手。例如,用戶可以利用 ChatGPT 來(lái)預(yù)訂航班或計(jì)算復(fù)雜的方程式。
盡管 ChatGPT 插件并非完全自主的 Agent,但它們通過(guò)動(dòng)態(tài)響應(yīng)提示并利用外部工具來(lái)完成任務(wù),實(shí)現(xiàn)了類(lèi)似 Agent 的行為。對(duì)于開(kāi)發(fā)者而言,這意味著可以以更低的成本構(gòu)建自己的工作流程。
除了 ChatGPT 插件,OpenAI 還發(fā)布了首款 AI 智能體工具 Operator(意為操作員)。Operator 能夠代理用戶執(zhí)行基于網(wǎng)頁(yè)的操作,簡(jiǎn)單來(lái)說(shuō),它能夠像人類(lèi)一樣使用網(wǎng)頁(yè)瀏覽器。
6、AutoGPT:自主任務(wù)執(zhí)行領(lǐng)域的先驅(qū)
AutoGPT 是一個(gè)實(shí)驗(yàn)性的開(kāi)源項(xiàng)目,它將 GPT 模型轉(zhuǎn)化為能夠在極少人工干預(yù)的情況下執(zhí)行復(fù)雜、多步驟任務(wù)的自主 Agent。借助 GPT-4 的強(qiáng)大能力,AutoGPT 能夠?qū)?fù)雜目標(biāo)拆解為更小的、可執(zhí)行的任務(wù),依次執(zhí)行這些任務(wù),并根據(jù)結(jié)果進(jìn)行迭代,以達(dá)成預(yù)期目標(biāo)。這使得 AutoGPT 成為最早被開(kāi)發(fā)者廣泛采用的自主 AI Agent 示例之一。
盡管仍處于早期階段,AutoGPT 通過(guò)展示自主 Agent 的潛力,激發(fā)了 AI 社區(qū)的想象力。開(kāi)發(fā)者們可以借鑒它的思路,構(gòu)建復(fù)雜的應(yīng)用程序,例如研究助手、自動(dòng)化工作流程管理器等。AutoGPT 突顯了 AI Agent 不斷增長(zhǎng)的趨勢(shì):它們不僅提供答案,還能采取行動(dòng),為未來(lái)更復(fù)雜的自主系統(tǒng)鋪平了道路。
AutoGPT 的架構(gòu)設(shè)計(jì)主要圍繞以下幾個(gè)核心功能展開(kāi):
https://hub.baai.ac.cn/view/27039
- 任務(wù)分解
AutoGPT 能夠?qū)?fù)雜的目標(biāo)分解為更小的、可執(zhí)行的任務(wù),依次執(zhí)行這些任務(wù),并根據(jù)結(jié)果進(jìn)行迭代,以達(dá)成預(yù)期目標(biāo)。
- 自主決策
AutoGPT 利用 GPT-4 的強(qiáng)大能力,能夠自主決策并執(zhí)行任務(wù),無(wú)需過(guò)多人工干預(yù)。
- 多步驟任務(wù)執(zhí)行
AutoGPT 支持多步驟任務(wù)的執(zhí)行,能夠根據(jù)任務(wù)的復(fù)雜性動(dòng)態(tài)調(diào)整執(zhí)行路徑。
- 迭代優(yōu)化
AutoGPT 根據(jù)任務(wù)執(zhí)行的結(jié)果進(jìn)行迭代優(yōu)化,逐步改進(jìn)任務(wù)執(zhí)行的效率和準(zhǔn)確性。
7、BabyAGI:用于可擴(kuò)展解決方案的輕量級(jí)任務(wù)自動(dòng)化工具
BabyAGI 是一款輕量級(jí)的開(kāi)源自主 Agent,專注于以迭代和智能的方式執(zhí)行任務(wù),由 GPT-4 驅(qū)動(dòng)。它在任務(wù)管理和執(zhí)行方面表現(xiàn)出色,是面向任務(wù)的 AI 解決方案中的佼佼者。其模塊化設(shè)計(jì)允許開(kāi)發(fā)者根據(jù)需求自定義工作流程,與各種數(shù)據(jù)庫(kù)集成,并構(gòu)建特定的解決方案。
與僅響應(yīng)孤立查詢的普通大語(yǔ)言模型不同,BabyAGI 能夠根據(jù)總體目標(biāo)創(chuàng)建任務(wù)隊(duì)列,對(duì)任務(wù)進(jìn)行優(yōu)先級(jí)排序,并逐步完成它們。例如,面對(duì)“研究一個(gè)主題并總結(jié)研究結(jié)果”這樣的復(fù)雜指令時(shí),BabyAGI 會(huì)自主地將其分解為子任務(wù),如收集資源、分析內(nèi)容和起草連貫的總結(jié)。
BabyAGI 的獨(dú)特之處在于其輕量級(jí)和可擴(kuò)展的設(shè)計(jì)。它在不需要大量資源的情況下,就能提供核心 AI 功能,為預(yù)算有限的企業(yè)提供了一個(gè)易于使用的工具。此外,其自適應(yīng)學(xué)習(xí)系統(tǒng)會(huì)隨著用戶需求的變化而發(fā)展,確保隨著時(shí)間的推移提供越來(lái)越個(gè)性化和高效的幫助。最近的更新還引入了增強(qiáng)的協(xié)作功能,使 BabyAGI 成為小型團(tuán)隊(duì)處理共享項(xiàng)目的優(yōu)秀工具。
8、甲骨文 Miracle Agent:面向企業(yè)數(shù)據(jù)驅(qū)動(dòng)決策 AI 工具
Oracle 的 Miracle Agent 是一套由 50 多個(gè)專門(mén)的 AI Agent 組成的工具集,專為企業(yè)環(huán)境設(shè)計(jì),專注于數(shù)據(jù)庫(kù)管理。通過(guò)深度集成到 Oracle 的云生態(tài)系統(tǒng)中,Miracle Agent 實(shí)現(xiàn)了數(shù)據(jù)處理和可視化的自動(dòng)化,使公司能夠在極少人工干預(yù)的情況下獲得洞察。
例如,Shift Scheduling 助手可以幫助創(chuàng)建和管理員工的輪班時(shí)間表,同時(shí)考慮個(gè)人偏好和合規(guī)規(guī)定。Employee Hiring Advisor 可以協(xié)助尋找候選人并簡(jiǎn)化招聘流程,縮短招聘時(shí)間。在供應(yīng)鏈管理方面,Customer Sales Representative Guide 可以提供個(gè)性化的洞察,以增強(qiáng)客戶互動(dòng)。
9、MultiOn Agent API:為開(kāi)發(fā)者簡(jiǎn)化網(wǎng)頁(yè)自動(dòng)化
MultiOn Agent API 是為開(kāi)發(fā)者構(gòu)建的專業(yè)級(jí)集成平臺(tái),支持將 AI Agent 無(wú)縫部署至多樣化應(yīng)用場(chǎng)景與終端設(shè)備。該平臺(tái)通過(guò)先進(jìn)的網(wǎng)頁(yè)自動(dòng)化能力,顯著提升任務(wù)執(zhí)行效率并優(yōu)化終端用戶體驗(yàn)。自2024年4月公測(cè)發(fā)布以來(lái),開(kāi)發(fā)者已可利用其構(gòu)建具備復(fù)雜網(wǎng)頁(yè)操作能力的AI代理,包括但不限于:
- 動(dòng)態(tài)網(wǎng)站導(dǎo)航與交互
- 多源數(shù)據(jù)智能提取
- 全流程在線交易自動(dòng)化
平臺(tái)提供 Python/JavaScript 雙語(yǔ)言 SDK ,并與主流大語(yǔ)言模型框架(如LangChain、LlamaIndex)實(shí)現(xiàn)深度兼容。這種開(kāi)箱即用的集成特性使開(kāi)發(fā)者能夠快速構(gòu)建高階應(yīng)用,包括:
- 自適應(yīng)網(wǎng)頁(yè)瀏覽器
- 智能數(shù)據(jù)采集系統(tǒng)
- 網(wǎng)頁(yè)內(nèi)容管理自動(dòng)化解決方案
圖片
10、亞馬遜 Bedrock Agents:企業(yè)工作流程智能自動(dòng)化工具
AWS Bedrock Agents 是亞馬遜云科技推出的創(chuàng)新AI代理服務(wù),旨在將AWS強(qiáng)大的基礎(chǔ)模型與企業(yè)工具及數(shù)據(jù)無(wú)縫集成,為開(kāi)發(fā)者提供構(gòu)建智能應(yīng)用的完整解決方案。
第一、靈活多變的 AI Agent 能力
Bedrock Agents 以其卓越的靈活性著稱,適用于多種 AI 驅(qū)動(dòng)場(chǎng)景:
智能客服:打造自然交互的客戶支持聊天機(jī)器人
流程自動(dòng)化:優(yōu)化后端業(yè)務(wù)流程,提升運(yùn)營(yíng)效率
個(gè)性化推薦:構(gòu)建精準(zhǔn)的推薦系統(tǒng),增強(qiáng)用戶體驗(yàn)
此外,Bedrock Agents 內(nèi)置豐富的 AP I支持,可輕松與企業(yè)現(xiàn)有技術(shù)棧集成。基于 Serverless 架構(gòu),該服務(wù)天然具備彈性擴(kuò)展能力,無(wú)需額外管理基礎(chǔ)設(shè)施。
第二、向量數(shù)據(jù)庫(kù):AI Agent 的智能記憶核心
現(xiàn)代 AI Agent(如AutoGPT、Google Astra等)不僅能夠處理數(shù)據(jù),更能像人類(lèi)一樣進(jìn)行推理與決策。而實(shí)現(xiàn)這一能力的關(guān)鍵在于長(zhǎng)期記憶系統(tǒng)——這正是向量數(shù)據(jù)庫(kù)的核心價(jià)值所在。
第三、為什么向量數(shù)據(jù)庫(kù)至關(guān)重要?
采用高維向量存儲(chǔ)技術(shù),精準(zhǔn)捕捉文本、圖像、音頻等非結(jié)構(gòu)化數(shù)據(jù)的語(yǔ)義信息
支持高效的相似性搜索與上下文檢索,使 Agent 能夠快速調(diào)用歷史知識(shí)
行業(yè)領(lǐng)先解決方案(如Milvus、Zilliz Cloud)為AI Agent提供高速、可擴(kuò)展的記憶管理
第四、實(shí)際應(yīng)用示例
當(dāng) Agent 遇到新問(wèn)題時(shí),可實(shí)時(shí)查詢向量數(shù)據(jù)庫(kù),檢索過(guò)往相似案例或相關(guān)知識(shí),從而做出更精準(zhǔn)的決策。缺乏這種記憶能力的 Agent,將難以實(shí)現(xiàn)持續(xù)學(xué)習(xí)和復(fù)雜推理,極大限制其智能化水平。
Bedrock Agents 結(jié)合向量數(shù)據(jù)庫(kù)技術(shù),為企業(yè)提供了構(gòu)建下一代 AI 應(yīng)用的強(qiáng)大基石。
本文中介紹的這些 AI Agent 僅僅是 2025 年代表性產(chǎn)品中的一小部分,其他有前景的 Agent,如 Anthropic Claude Agents、Hugging Face Transformers Agents 以及 Llamaindex 的 Llama Agents,同樣值得關(guān)注。
如果這些 Agent 都不能滿足您的需求,我們可以利用向量數(shù)據(jù)庫(kù)、大語(yǔ)言模型輕松構(gòu)建自己的 AI Agent。
本文轉(zhuǎn)載自公眾號(hào)玄姐聊AGI 作者:玄姐
