自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<thead id="4bbmm"></thead>}

<cite id="4bbmm"><track id="4bbmm"></track></cite>

<cite id="4bbmm"></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

如何從0開始構建一個通用AI Agent 智能體架構設計和實現(xiàn)？原創(chuàng)

發(fā)布于 2025-1-14 14:08

瀏覽

0收藏

AI Agent 智能體，目前更具體地指的是 LLM Agent。這是一種程序，其執(zhí)行邏輯受其底層模型（LLM）的操控。

如何從0開始構建一個通用AI Agent 智能體架構設計和實現(xiàn)？-AI.x社區(qū)

與少樣本提示或固定工作流等手段相比，LLM Agent 的獨特之處在于它能定義并調(diào)整執(zhí)行用戶查詢所需的步驟。若能訪問一系列工具（例如：代碼執(zhí)行或網(wǎng)絡搜索），AI Agent 智能體能夠決定采用何種工具、如何運用它，并根據(jù)輸出結果進行迭代優(yōu)化。這種靈活性使得系統(tǒng)能以最低限度的配置應對多樣化的應用場景。

如何從0開始構建一個通用AI Agent 智能體架構設計和實現(xiàn)？-AI.x社區(qū)

AI Agent 智能體架構涵蓋了從固定工作流的可靠性到自主 AI Agent 智能體的廣泛領域。例如，像檢索增強生成（RAG）這樣的固定流程可以通過自我反思循環(huán)進行優(yōu)化，使得程序在初始響應不足時能夠進行改進。而ReAct 智能體則可以配備固定流程作為工具，提供一種既靈活又結構化的處理方式。架構的選擇最終依賴于具體的應用場景以及可靠性與靈活性之間的最佳平衡。

如何從0開始構建一個通用AI Agent 智能體架構設計和實現(xiàn)？-AI.x社區(qū)

接下來，我將向大家展示如何從0開始構建一個通用的 AI Agent 智能體。

1、步驟一：選擇正確的大模型（LLM）

挑選合適的大模型對于 AI Agent 智能體達到預期的性能表現(xiàn)至關重要。在決策過程中，需要考慮多個因素，如許可協(xié)議、成本和語言兼容性。在構建 LLM Agent 時，最關鍵的考量是模型在編碼、工具調(diào)用和推理等核心任務上的表現(xiàn)。以下是一些用于評估的基準：

大規(guī)模多任務語言理解（MMLU）（用于推理能力）；
伯克利函數(shù)調(diào)用排行榜（用于工具選擇和調(diào)用）；
HumanEval 和 BigCodeBench（用于編碼能力）；

另一個重要的考量因素是大模型的上下文窗口大小。AI Agent 智能體的工作流程可能會消耗大量 token——有時甚至達到10萬或更多——因此，更大的上下文窗口將非常有益。

以下是一些你可能需要考慮的大模型：

閉源模型：GPT4-o、Claude 3.5
開源模型：Llama 3.2、Qwen 2.5

通常情況下，大模型越大，性能表現(xiàn)越佳，但能夠在本地運行的較小模型也是一個不錯的選擇。對于較小的模型，你可能只能處理更簡單的用例，并且可能只能將你的 AI Agent 智能體與一兩個基礎工具相連接。

2、步驟二：定義 AI Agent 智能體的控制邏輯

簡單 LLM 與 AI Agent 智能體之間的核心差異體現(xiàn)在系統(tǒng)提示詞（System Prompt）上。

如何從0開始構建一個通用AI Agent 智能體架構設計和實現(xiàn)？-AI.x社區(qū)

在 LLM 的情境中，系統(tǒng)提示詞是在模型開始處理用戶查詢之前，提供給模型的一系列指令和背景信息。

可以在系統(tǒng)提示詞中明確 LLM 所應展現(xiàn)的 AI Agent 智能體行為。

以下是一些常見的 AI Agent 智能體模式，它們可以根據(jù)您的具體需求進行調(diào)整：

工具使用：AI Agent 智能體判斷何時應將查詢導向適當?shù)墓ぞ?，或者何時依賴自身的知識庫。
反思：AI Agent 智能體在向用戶回復之前，會審視并修正其答案。大多數(shù) LLM 系統(tǒng)也可以加入反思步驟。
推理后行動（ReAct）：AI Agent 智能體會不斷推理如何解決查詢，執(zhí)行操作，觀察結果，并決定是否需要采取進一步行動或給出回應。
計劃后執(zhí)行：AI Agent 智能體會預先規(guī)劃任務，如有必要，將任務分解為子步驟，然后逐一執(zhí)行這些步驟。

最后兩種模式（ReAct 和計劃后執(zhí)行）通常是構建多功能單一 AI Agent 智能體的良好起點。

如何從0開始構建一個通用AI Agent 智能體架構設計和實現(xiàn)？-AI.x社區(qū)

為了有效地實現(xiàn)這些行為，需要進行一定的提示詞工程（Prompt Engineering）。你可能還需要利用結構化生成技術。這實質(zhì)上是指引導 LLM 的輸出，使其符合特定的格式或模式，以確保 AI Agent 智能體的響應與您期望的溝通風格保持一致。

3、步驟三：定義 AI Agent 智能體的核心指令

我們常常默認 LLM 擁有一系列即時的功能。雖然某些功能可能非常出色，但也有一些可能不完全符合我們的期望。為了實現(xiàn)我們所追求的性能，在系統(tǒng)提示詞中詳盡地闡述我們希望包含和排除的功能至關重要。

這可能涉及以下指導：

AI Agent 智能體的名稱和角色：指定 AI Agent 智能體的名稱及其用途。
語氣和簡潔度：確定 AI Agent 智能體的回應應該是正式還是非正式，以及回應的簡潔程度。
使用工具的時機：明確何時應依賴外部工具而非模型自身的知識庫。
錯誤處理：指導 AI Agent 智能體在遇到工具或流程問題時應采取的行動。

4、步驟四：定義并優(yōu)化你的核心工具

工具為你的 AI Agent 智能體提供了超乎尋常的能力。通過使用一組精心定義的工具，你可以實現(xiàn)多樣化的功能。其中不可或缺的工具包括代碼執(zhí)行、網(wǎng)絡搜索、文件讀取和數(shù)據(jù)分析。

對于每一項工具，你需要定義以下內(nèi)容，并將其納入系統(tǒng)提示詞的一部分：

工具名稱：為功能提供一個唯一且具有描述性的名稱。
工具描述：清晰地闡述工具的作用及其適用場景。這有助于 AI Agent 智能體判斷何時應該選用該工具。
工具輸入格式：描述必需和可選參數(shù)、它們的類型以及任何相關限制的格式。AI Agent 智能體將根據(jù)用戶的查詢使用這些信息來填充所需的輸入。
關于工具運行位置或方法的指示詞。

在某些情況下，你可能需要優(yōu)化工具以達到預期的性能。這可能包括對工具名稱或描述進行快速工程調(diào)整、設置高級配置以處理常見問題，或者對工具的輸出進行篩選。

5、步驟五：制定可靠的記憶處理策略

LLM 受限于其上下文窗口，即它們一次能夠“記住”的令牌數(shù)量。這種記憶空間很快就會被多輪對話中的歷史交流、冗長的工具輸出或 AI Agent 智能體依賴的額外上下文所充滿。因此，確立一個有效的記憶管理策略至關重要。

在 AI Agent 智能體的框架內(nèi)，記憶涉及系統(tǒng)存儲、檢索和利用過往互動信息的能力。這允許 AI Agent 智能體隨時間維持上下文，基于先前的交流優(yōu)化其響應，并交付更加定制化的體驗。

常見的記憶管理策略包括：

滑動記憶：保留最近 k 輪對話回合的記憶，并移除較早的對話回合。
令牌記憶：保持最后n個令牌，遺忘其他令牌。
總結記憶：利用 LLM 對每個對話回合進行總結，并移除單獨的消息。

此外，可以訓練 LLM 識別關鍵信息以存儲在長期記憶中。這樣，AI Agent 智能體就能“記住”關于用戶的重要細節(jié)，從而提供更加個性化的體驗。

至此，我們概述的五個步驟為構建 AI Agent 智能體奠定了基礎。但是，如果在當前階段通過 LLM 處理用戶查詢，結果會怎樣呢？

如何從0開始構建一個通用AI Agent 智能體架構設計和實現(xiàn)？-AI.x社區(qū)

此時，AI Agent 智能體會生成原始的文本輸出。那么，我們?nèi)绾问蛊鋱?zhí)行后續(xù)操作呢？這就需要解析和編排的功能了。

6、步驟六：解析 AI Agent 智能體的原始輸出

解析器是一種功能，它負責將原始數(shù)據(jù)轉換成應用程序能夠理解和操作的格式，例如帶有屬性的對象。

在構建我們的 AI Agent 智能體時，解析器需要辨識在第二步中設定的通信結構，并且輸出結構化數(shù)據(jù)，例如 JSON 格式。這樣做可以讓應用程序更輕松地處理和執(zhí)行 AI Agent 智能體的后續(xù)動作。

注意：某些模型供應商（例如 OpenAI）可能默認提供可以直接解析的輸出。而對于其他模型，尤其是開源模型，可能需要額外的配置來生成可解析的輸出。

7、步驟七：安排 AI Agent 智能體下一步行動

最終步驟是確立編排邏輯。這一邏輯決定了在 LLM 產(chǎn)生輸出之后將發(fā)生什么?；谳敵鰞?nèi)容，你可以執(zhí)行以下操作：

調(diào)用工具，或者
返回答案— 這可以是針對用戶查詢的直接回應，或者是請求更多信息的后續(xù)動作。

如何從0開始構建一個通用AI Agent 智能體架構設計和實現(xiàn)？-AI.x社區(qū)

當觸發(fā)工具調(diào)用時，工具的輸出會被送回給LLM（作為其工作內(nèi)存的一部分）。隨后，LLM將決定如何處理這些新數(shù)據(jù)：是進行另一個工具調(diào)用還是向用戶給出答案。

以下是在代碼中實現(xiàn)這種編排邏輯的一個示例：

如何從0開始構建一個通用AI Agent 智能體架構設計和實現(xiàn)？-AI.x社區(qū)

8、步驟八：多 AI Agent 智能體的設計

盡管當前的 LLM 非常強大，但它們面臨一個主要的挑戰(zhàn)：處理信息過載的能力有限。過多的上下文或工具使用可能會導致模型負擔過重，進而影響性能。單一的通用 AI Agent 智

能體最終可能會觸及這個極限，尤其是考慮到 AI Agent 智能體對 token 的巨大需求。

在某些情況下，采用多 AI Agent 智能體架構可能更為合適。通過將任務分配給多個 AI Agent 智能體，可以避免單個 LLM Agen t的上下文過載，并提升整體的運作效率。

盡管如此，單一的通用 AI Agent 智能體架構是原型設計的極佳起點。它允許你快速驗證用例并識別系統(tǒng)開始出現(xiàn)問題的點。通過這個過程，你可以：

了解哪些任務部分真正從 AI Agent 智能體方法中受益。
確定可以在更復雜的工作流程中作為獨立模塊分離的組件。

從單一 AI Agent 智能體出發(fā)可以提供寶貴的洞見，這些洞見在擴展到更復雜的系統(tǒng)時有助于優(yōu)化你的方法。

準備好深入探索并開始構建了嗎？使用框架是快速測試和迭代 AI Agent 智能體配置的有效途徑：

如果計劃使用 Llama 3 等開源模型，可以嘗試 Bee Agent Framework。

如果計劃使用 OpenAI 等前沿模型，可以嘗試 LangGraph。

本文轉載自公眾號玄姐聊AGI 作者：玄姐

原文鏈接：??https://mp.weixin.qq.com/s/juddgUsa0MOzjTzOrkEkgw??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關推薦

不要上來就大模型，從訓練一個小模型開始

AI探索時代 ? 2474瀏覽 ? 0回復
從0到1開發(fā)AI Agent（智能體）| LangChain 的快速入門

AI取經(jīng)路 ? 5785瀏覽 ? 0回復
我們聊聊如何構建通用LLM Agent

鴻煊的學習筆記 ? 2558瀏覽 ? 0回復
Reyes：一個從0到1開始訓練的多模態(tài)大模型（技術報告）

大模型自然語言處理 ? 1971瀏覽 ? 0回復
Agentic AI 系統(tǒng)設計：AI Agent 智能體架構設計與實踐

玄姐聊AGI ? 3758瀏覽 ? 0回復
從0開始：用 Streamlit + LangChain 搭建個簡易ChatGPT

AI取經(jīng)路 ? 3224瀏覽 ? 0回復
Manus 架構設計揭秘：解構下一代 AI Agent 多智能體架構

玄姐聊AGI ? 3205瀏覽 ? 0回復
基于LangGraph的智能文章生成Agent架構設計思路

九歌AI大模型 ? 1802瀏覽 ? 0回復
Manus AI ：如何讓AI從 "動口" 到 "動手" 的多智能體架構！

Halo咯咯 ? 2101瀏覽 ? 0回復
構建以數(shù)據(jù)為中心的 Agent 智能體全局架構設計

玄姐聊AGI ? 1666瀏覽 ? 0回復
從 Manus 到 DeepSearcher，2025年最值得關注的十大 Agent 智能體架構設計

玄姐聊AGI ? 3327瀏覽 ? 0回復
Manus 技術架構設計剖析和復刻落地實現(xiàn)

玄姐聊AGI ? 1757瀏覽 ? 0回復
MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā)

玄姐聊AGI ? 8614瀏覽 ? 0回復
MCP 架構設計演進：從 Local MCP Server 到 Remote MCP Server 開源架構設計實現(xiàn)

玄姐聊AGI ? 4462瀏覽 ? 0回復
從 MCP 到 A2A，AI Agent 應用架構設計演進之路

玄姐聊AGI ? 1103瀏覽 ? 0回復
5W字長文 Agent多智能體探秘：架構設計、交互模式與應用實踐深度剖析

柏企閱文 ? 1094瀏覽 ? 0回復
谷歌 A2A （Agent2Agent）架構設計深度剖析

玄姐聊AGI ? 1120瀏覽 ? 0回復
從 Local MCP Server 到 Remote MCP Server 架構設計演進

玄姐聊AGI ? 1241瀏覽 ? 0回復
使用Llama 4和AutoGen構建一個AI智能體

51CTO內(nèi)容精選 ? 305瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

Mem0 推出王炸 MCP 工具 OpenMemory，實現(xiàn)不同 AI 應用之間記憶共享 19h前發(fā)布
MCP 之后又一 AI Agent 協(xié)議刷屏了：AG-UI 協(xié)議架構設計剖析 3天前發(fā)布

熱門推薦

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復

MCP 之后又一 AI Agent 協(xié)議刷屏了：AG-UI 協(xié)議架構設計剖析 0回復

基于阿里通義 Qwen3 混合推理模型才是優(yōu)化 RAG 和 MCP 的最佳范式 0回復

基于 Spring AI Alibaba 的 RAG 架構調(diào)優(yōu)實踐 0回復

別搞 GraphRAG 了，擁抱新一代 RAG 范式 DeepSearcher 0回復

上一篇：谷歌剛剛發(fā)布AI Agent智能體白皮書，2025年AI Agent時代已到來！

下一篇： 2025年，AI Agent 智能體開發(fā)框架如何優(yōu)雅選型？

社區(qū)精華內(nèi)容

目錄

<bdo id="eutjj"></bdo>