自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式 原創(chuàng)

發(fā)布于 2025-3-27 10:29
瀏覽
0收藏

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)


1、什么是RAG?

??RAG 作為一種提升生成式 AI 模型表現(xiàn)的框架,通過(guò)檢索外部知識(shí)源,增強(qiáng)生成內(nèi)容的準(zhǔn)確性與豐富度。AI Agent 則是具備感知、推理、行動(dòng)和學(xué)習(xí)能力的自主軟件系統(tǒng),能在復(fù)雜環(huán)境中完成任務(wù)。二者結(jié)合,讓 AI 系統(tǒng)擁有更強(qiáng)大的功能。

 . ??傳統(tǒng) RAG 存在檢索時(shí)機(jī)難定、文檔質(zhì)量不佳、易生成錯(cuò)誤信息等問(wèn)題。Agentic RAG 系統(tǒng)有效解決了這些痛點(diǎn),在客戶支持、內(nèi)容創(chuàng)作、研究輔助、工作流自動(dòng)化等場(chǎng)景廣泛應(yīng)用。例如在客戶支持中,它能快速檢索實(shí)時(shí)數(shù)據(jù),精準(zhǔn)回應(yīng)客戶咨詢;內(nèi)容創(chuàng)作時(shí),依托檢索知識(shí),在專業(yè)領(lǐng)域產(chǎn)出高質(zhì)量?jī)?nèi)容。

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)

典型的 RAG 應(yīng)用有兩個(gè)相當(dāng)大的局限性:簡(jiǎn)單的 RAG 管道僅考慮一個(gè)外部知識(shí)源。但是,有些解決方案可能需要兩個(gè)外部知識(shí)源,而有些解決方案可能需要外部工具和 API,例如網(wǎng)絡(luò)搜索。它們是一次性解決方案,這意味著上下文只被檢索一次。對(duì)檢索到的上下文的質(zhì)量沒(méi)有任何推理或驗(yàn)證。

一個(gè)流行的框架是ReAct 框架。ReAct 代理可以通過(guò)將路由、查詢規(guī)劃和工具使用組合成一個(gè)實(shí)體來(lái)處理順序的多部分查詢,同時(shí)保持狀態(tài)(在內(nèi)存中)。ReAct = Reason + Act(With LLMs)

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)

該過(guò)程涉及以下步驟:

思考:收到用戶查詢后,代理會(huì)推斷下一步要采取的行動(dòng)

動(dòng)作:代理決定一個(gè)動(dòng)作并執(zhí)行它(例如,使用工具)

觀察:代理觀察動(dòng)作的反饋

該過(guò)程不斷重復(fù),直到代理完成任務(wù)并響應(yīng)用戶。


Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)

2、什么是Agentic RAG?

Agentic RAG就是一種融合了Agent能力的RAG,而Agent的核心能力是自主推理與行動(dòng)。所以Agentic RAG就是將AI智能體的自主規(guī)劃(如路由、行動(dòng)步驟、反思等)能力帶入到傳統(tǒng)的RAG,以適應(yīng)更加復(fù)雜的RAG查詢?nèi)蝿?wù)。

Agentic RAG如何應(yīng)對(duì)這些典型的復(fù)雜任務(wù)?一起來(lái)看。

在不同類型的RAG管道間自主選擇(路由),以適應(yīng)任務(wù)的多樣性:

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)

融合多種類型的RAG管道與數(shù)據(jù)源,以適應(yīng)綜合性復(fù)雜查詢?nèi)蝿?wù):

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)

與必要的外部工具協(xié)作,以增強(qiáng)輸出的準(zhǔn)確性:

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)

 . ??Agentic RAG 系統(tǒng)包含多種類型。Agentic RAG 路由器依據(jù)查詢特性,將任務(wù)分配至合適組件,單一路由器適用于簡(jiǎn)單場(chǎng)景,多路由器則能處理復(fù)雜系統(tǒng)的大量查詢。查詢規(guī)劃型 Agentic RAG 可通過(guò)智能分解、分布式處理和響應(yīng)合成,高效處理復(fù)雜查詢。

 . ??自適應(yīng) RAG 根據(jù)查詢復(fù)雜度選擇處理策略,簡(jiǎn)單問(wèn)題直接生成答案,復(fù)雜問(wèn)題多步驟檢索推理,提高計(jì)算效率與回答準(zhǔn)確性。主動(dòng)型糾錯(cuò) RAG 引入自我糾錯(cuò)機(jī)制,評(píng)估檢索文檔,重寫(xiě)查詢并結(jié)合網(wǎng)絡(luò)搜索,提升答案質(zhì)量。自反射 RAG 具備自我反思和邏輯推理能力,動(dòng)態(tài)檢索并自評(píng)輸出,減少幻覺(jué)現(xiàn)象。Speculative RAG 利用大小模型分工,小模型起草、大模型核查,實(shí)現(xiàn)快速準(zhǔn)確回答。Self Route Agentic RAG 讓 LLM 判斷能否回答問(wèn)題,合理調(diào)用長(zhǎng)上下文模型,平衡成本與性能。

 . ??Agentic RAG 系統(tǒng)憑借其創(chuàng)新架構(gòu)與強(qiáng)大功能,在 AI 領(lǐng)域取得顯著進(jìn)展。隨著技術(shù)不斷發(fā)展,它將在更多領(lǐng)域發(fā)揮重要作用,為 AI 創(chuàng)新奠定堅(jiān)實(shí)基礎(chǔ)。

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)

. ?為什么需要Agentic RAG?

 Agentic RAG的“智能體”特征主要體現(xiàn)在檢索階段,相對(duì)于傳統(tǒng)RAG的檢索,

Agentic RAG更能夠: 

??決定是否需要檢索

 ??自主決策使用哪個(gè)檢索引擎

 ??自主規(guī)劃使用檢索引擎的步驟 

??評(píng)估檢索到的上下文,并決定是否重新檢索 

??自行規(guī)劃是否需要借助外部工具 

. ?Agentic RAG 的應(yīng)用 

?客戶支持:通過(guò)訪問(wèn)實(shí)時(shí)數(shù)據(jù)源,自動(dòng)檢索并提供準(zhǔn)確的用戶查詢響應(yīng)。 

?內(nèi)容創(chuàng)作:生成復(fù)雜領(lǐng)域(如法律或醫(yī)療)中的上下文豐富的內(nèi)容,依托于檢索的知識(shí)。

?研究輔助:通過(guò)自主收集和綜合來(lái)自廣泛數(shù)據(jù)庫(kù)的相關(guān)材料,幫助研究人員。 

?工作流自動(dòng)化:通過(guò)將基于檢索的決策集成到企業(yè)流程中,簡(jiǎn)化企業(yè)運(yùn)營(yíng)。

Agentic RAG 架構(gòu)

與順序式簡(jiǎn)單 RAG 架構(gòu)相比,代理式 RAG 架構(gòu)的核心是代理。代理式 RAG 架構(gòu)可以具有各種復(fù)雜程度。在最簡(jiǎn)單的形式中,單代理 RAG 架構(gòu)是一個(gè)簡(jiǎn)單的路由器。但是,您也可以將多個(gè)代理添加到多代理 RAG 架構(gòu)中。本節(jié)討論了兩種基本的 RAG 架構(gòu)。

單代理 RAG(路由器)

最簡(jiǎn)單的形式是,agentic RAG 是一個(gè)路由器。這意味著您至少有兩個(gè)外部知識(shí)源,代理決定從哪個(gè)源檢索其他上下文。但是,外部知識(shí)源不必局限于(矢量)數(shù)據(jù)庫(kù)。您也可以從工具中檢索更多信息。例如,您可以進(jìn)行網(wǎng)絡(luò)搜索,或者您可以使用 API 從 Slack 頻道或您的電子郵件帳戶檢索其他信息。

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)

多代理 RAG 系統(tǒng)

正如您所猜測(cè)的,單代理系統(tǒng)也有其局限性,因?yàn)樗鼉H限于一個(gè)代理,集推理、檢索和答案生成于一體。因此,將多個(gè)代理鏈接到多代理 RAG 應(yīng)用程序中是有益的。

例如,您可以讓一個(gè)主代理協(xié)調(diào)多個(gè)專門檢索代理之間的信息檢索。一個(gè)代理可以從專有的內(nèi)部數(shù)據(jù)源檢索信息。另一個(gè)代理可以專門從您的個(gè)人帳戶(例如電子郵件或聊天)檢索信息。另一個(gè)代理還可以專門從網(wǎng)絡(luò)搜索中檢索公開(kāi)信息。

Agentic RAG 目前最強(qiáng)大的RAG實(shí)現(xiàn)方式-AI.x社區(qū)

Agentic RAG 與 普通RAG

雖然 RAG 的基本概念(發(fā)送查詢、檢索信息和生成響應(yīng))保持不變,但工具的使用對(duì)其進(jìn)行了概括,使其更加靈活和強(qiáng)大。

可以這樣想:普通(原始)RAG 就像在圖書(shū)館(智能手機(jī)出現(xiàn)之前)回答特定問(wèn)題。另一方面,Agentic RAG 就像手中拿著一部智能手機(jī),上面有網(wǎng)絡(luò)瀏覽器、計(jì)算器、電子郵件等。

從原始 RAG 到代理 RAG 的轉(zhuǎn)變使得這些系統(tǒng)能夠產(chǎn)生更準(zhǔn)確的響應(yīng)、自主執(zhí)行任務(wù)并更好地與人類合作。代理 RAG 的優(yōu)勢(shì)主要在于提高了檢索到的附加信息的質(zhì)量。通過(guò)添加具有工具使用權(quán)限的代理,檢索代理可以將查詢路由到專門的知識(shí)源。此外,代理的推理能力使檢索到的上下文在用于進(jìn)一步處理之前能夠進(jìn)行一層驗(yàn)證。因此,代理 RAG 管道可以帶來(lái)更穩(wěn)健、更準(zhǔn)確的響應(yīng)。

Agentic RAG 的局限性

然而,任何事物都有兩面性。使用 AI 代理執(zhí)行子任務(wù)意味著要結(jié)合 LLM 來(lái)完成任務(wù)。這帶來(lái)了在任何應(yīng)用程序中使用 LLM 的局限性,例如增加延遲和不可靠性。根據(jù) LLM 的推理能力,代理可能無(wú)法充分完成任務(wù)(甚至根本無(wú)法完成)。重要的是要結(jié)合適當(dāng)?shù)墓收夏J?,以幫?AI 代理在無(wú)法完成任務(wù)時(shí)擺脫困境。


本文轉(zhuǎn)載自公眾號(hào)數(shù)字化助推器  作者:天涯咫尺TGH

原文鏈接:??https://mp.weixin.qq.com/s/Og6f9tXFtY8mTcJlyuAcNg??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦