自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

文檔概要索引，簡單提升檢索性能的新選擇原創(chuàng)

發(fā)布于 2024-9-25 10:20

瀏覽

0收藏

今天介紹了一種全新的 LlamaIndex 數(shù)據(jù)結構：文檔摘要索引。將描述它如何比傳統(tǒng)語義搜索提供更好的檢索性能，并通過一個示例進行了演示。

背景

大型語言模型 (LLM) 的核心用例之一是針對自己的數(shù)據(jù)進行問答。為此，我們將 LLM 與“檢索”模型配對，該模型可以對知識語料庫執(zhí)行信息檢索，并使用 LLM 對檢索到的文本執(zhí)行響應合成。這個整體框架稱為檢索增強生成（RAG）。

目前，大多數(shù)構建 LLM 驅(qū)動的 QA 系統(tǒng)的用戶傾向于執(zhí)行以下操作：

獲取源文檔，將每個文檔拆分為文本塊
將文本塊存儲在向量數(shù)據(jù)庫中
在查詢時，通過嵌入相似性和/或關鍵字過濾器來檢索文本塊。
執(zhí)行響應合成?

由于各種原因，這種方法的檢索性能有限。

現(xiàn)有方法的局限性

使用文本塊進行嵌入檢索存在一些限制。

文本塊缺乏全局上下文。問題通常需要超出特定塊索引內(nèi)容的上下文。
仔細調(diào)整 top-k/相似度得分閾值。如果值太小，將錯過上下文。如果值太大，成本/延遲可能會隨著不相關上下文的增加而增加。
嵌入并不總是會選擇與問題最相關的上下文。嵌入本質(zhì)上是在文本和上下文之間分別確定的。

添加關鍵字過濾器是增強檢索結果的一種方法。但這也帶來了一系列挑戰(zhàn)。我們需要充分確定每個文檔的正確關鍵字，無論是手動還是通過 NLP 關鍵字提取/主題標記模型。此外，我們還需要從查詢中充分推斷出正確的關鍵字。

文檔概要索引

文檔概要索引，簡單提升檢索性能的新選擇-AI.x社區(qū)

文檔概要索引，它將提取/索引每個文檔的非結構化文本摘要。此索引可以幫助增強現(xiàn)有檢索方法之外的檢索性能。它有助于索引比單個文本塊更多的信息，并且比關鍵字標簽具有更多的語義含義。它還允許更靈活的檢索形式：我們可以進行 LLM 檢索和基于嵌入的檢索。

工作原理

在構建期間，我們會提取每個文檔，并使用 LLM 從每個文檔中提取摘要，還將文檔拆分為文本塊（節(jié)點）。摘要和節(jié)點都存儲在我們的文檔存儲抽象中。我們維護從摘要到源文檔/節(jié)點的映射。

在查詢期間，我們根據(jù)摘要檢索與查詢相關的文檔，使用以下方法：

基于 LLM 的檢索：我們向 LLM 提供一系列文檔摘要，并要求 LLM 確定哪些文檔是相關的 + 它們的相關性分數(shù)。
基于嵌入的檢索：我們根據(jù)摘要嵌入相似度（具有前 k 個截止值）檢索相關文檔。

注意，這種文檔摘要檢索方法（即使采用基于嵌入的方法）與基于嵌入的文本塊檢索不同。文檔摘要索引的檢索類會檢索任何選定文檔的所有節(jié)點，而不是返回節(jié)點級別的相關塊。

存儲文檔摘要還可以實現(xiàn)基于 LLM 的檢索。我們不必一開始就將整個文檔提供給 LLM，而是先讓 LLM 檢查簡明的文檔摘要，看看它是否與查詢相關。這利用了 LLM 的推理能力，這些能力比基于嵌入的查找更先進，但避免了將整個文檔提供給 LLM 的成本/延遲。

更多

帶摘要的文檔檢索可以看作是所有文檔中的語義搜索和強力摘要之間的“中間地帶”。我們根據(jù)給定查詢的摘要相關性查找文檔，然后返回與檢索到的文檔相對應的所有“節(jié)點”。

我們?yōu)槭裁匆@樣做？這種檢索方法通過在文檔級別檢索上下文，為用戶提供了比文本塊上的 top-k 更多的上下文。但是，它也是一種比主題建模更靈活/自動化的方法；無需再擔心您的文本是否具有正確的關鍵字標簽！

代碼示例

下面展示部分構建代碼，完整代碼地址：

https://docs.llamaindex.ai/en/stable/examples/index_structs/doc_summary/DocSummary/

from llama_index import (
    SimpleDirectoryReader,
    LLMPredictor,
    ServiceContext,
    ResponseSynthesizer
)
from llama_index.indices.document_summary import GPTDocumentSummaryIndex
from langchain.chat_models import ChatOpenAI


# load docs, define service context
...


# build the index
response_synthesizer = ResponseSynthesizer.from_args(response_mode="tree_summarize", use_async=True)
doc_summary_index = GPTDocumentSummaryIndex.from_documents(
    city_docs, 
    service_cnotallow=service_context,
    response_synthesizer=response_synthesizer
)

一旦索引建立，我們就可以獲得任何給定文檔的摘要：

summary = doc_summary_index.get_document_summary("Boston")

接下來，讓我們看一個基于 LLM 的索引檢索示例。

from llama_index.indices.document_summary import DocumentSummaryIndexRetriever


retriever = DocumentSummaryIndexRetriever(
    doc_summary_index,
    # choice_select_prompt=choice_select_prompt,
    # choice_batch_size=choice_batch_size,
    # format_node_batch_fn=format_node_batch_fn,
    # parse_choice_select_answer_fn=parse_choice_select_answer_fn,
    # service_cnotallow=service_context
)
retrieved_nodes = retriever.retrieve("What are the sports teams in Toronto?")
print(retrieved_nodes[0].score)
print(retrieved_nodes[0].node.get_text())The retriever will retrieve a set of relevant nodes for a given index.

請注意，LLM 除了返回文檔文本之外，還返回相關性分數(shù)：

8.0
Toronto ( (listen) t?-RON-toh; locally [t???????] or [?t?????]) is the capital city of the Canadian province of Ontario. With a recorded population of 2,794,356 in 2021, it is the most populous city in Canada...

我們還可以將索引用作整體查詢引擎的一部分，不僅可以檢索相關上下文，還可以合成給定問題的答案。我們可以通過高級 API 和低級 API 來實現(xiàn)這一點。

高級 API

query_engine = doc_summary_index.as_query_engine(
  response_mode="tree_summarize", use_async=True
)
response = query_engine.query("What are the sports teams in Toronto?")
print(response)

低級 API

# use retriever as part of a query engine
from llama_index.query_engine import RetrieverQueryEngine


# configure response synthesizer
response_synthesizer = ResponseSynthesizer.from_args()


# assemble query engine
query_engine = RetrieverQueryEngine(
    retriever=retriever,
    response_synthesizer=response_synthesizer,
)


# query
response = query_engine.query("What are the sports teams in Toronto?")
print(response)

本文轉(zhuǎn)載自公眾號哎呀AIYA

原文鏈接：??https://mp.weixin.qq.com/s/USkhLo_qDhvZKoMTQAXquQ??

?著作權歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責任

標簽

大型語言模型

贊

收藏

回復

舉報

回復

相關推薦

MRAG：一種多頭RAG，提升具有顯著不同內(nèi)容的多個文檔復雜查詢的檢索準確性

PaperAgent ? 3920瀏覽 ? 0回復
再次提升RAG性能：兩種高效的Rerank模型實踐指南

AIGC觀察者 ? 2.0w瀏覽 ? 0回復
RAG技術性能提升之文檔分塊策略方案

AIGC觀察者 ? 4936瀏覽 ? 0回復
RAPTOR 檢索樹再次進一步提升RAG性能的設計思路

AIGC觀察者 ? 3781瀏覽 ? 0回復
介紹一種實用的RAG技術：父文檔檢索（PDR）

51CTO內(nèi)容精選 ? 2493瀏覽 ? 0回復
RAG高級優(yōu)化：基于問題生成的文檔檢索增強

恰似驚鴻 ? 2926瀏覽 ? 0回復
改進RAG管道檢索文檔質(zhì)量的五種方法

51CTO內(nèi)容精選 ? 2462瀏覽 ? 0回復
RAG 的未來 - 自動文檔檢索

探索AGI ? 2269瀏覽 ? 0回復
多模態(tài)RAG-ColPali：使用視覺語言模型實現(xiàn)高效的文檔檢索

大模型自然語言處理 ? 2526瀏覽 ? 0回復
TextIn：一款優(yōu)秀的文檔解析神器，提升RAG性能必備

恰似驚鴻 ? 3827瀏覽 ? 0回復
提升RAG性能的全攻略：優(yōu)化檢索增強生成系統(tǒng)的策略大揭秘

Halo咯咯 ? 5541瀏覽 ? 0回復
文檔截圖嵌入統(tǒng)一多模態(tài)檢索方法原理

大模型自然語言處理 ? 1990瀏覽 ? 0回復
再談大模型向量，由向量檢索引起的思考

AI探索時代 ? 1901瀏覽 ? 0回復
阿里巴巴語音實驗室發(fā)布新成果，多模態(tài)方法顯著提升視頻主題分割性能

xuxiangda ? 2222瀏覽 ? 0回復
中科大揭秘微調(diào)大模型的秘訣：如何精準選擇數(shù)據(jù)提升AI性能

AI論文解讀 ? 2806瀏覽 ? 0回復
RAG圈的DeepSeek，中科院DeepRAG讓大模型帶著“思考”檢索，性能提升21.99%

PaperAgent ? 3144瀏覽 ? 0回復
ViDoRAG：提升視覺RAG性能10%

大語言模型論文跟蹤 ? 1830瀏覽 ? 0回復
18種RAG技術大比拼：誰才是檢索增強生成的最佳選擇？

Halo咯咯 ? 1656瀏覽 ? 0回復
英偉達押注Agent新基建！AI專屬搜索引擎問世

探索AGI ? 1307瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

LLM-R：基于RAG和層次化Agent落地案例解析 2024-11-15 09:58:18發(fā)布
TextIn：一款優(yōu)秀的文檔解析神器，提升RAG性能必備 2024-11-13 09:10:07發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實戰(zhàn)教程 0回復

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復

2025年最值得關注的十大多模態(tài)大語言模型！ 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

從零到一構建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復

上一篇： RAG高級優(yōu)化：檢索后處理模塊成竹在胸

下一篇： Auto-Retrieval: RAG的智能進化

社區(qū)精華內(nèi)容

目錄