自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="d8eqy"></pre>

<ruby id="d8eqy"><samp id="d8eqy"></samp></ruby>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

TreeHop：無需大語言模型的高效多跳問答新范式

大語言模型論文跟蹤

發(fā)布于 2025-5-7 00:36

瀏覽

0收藏

項目倉庫：https://github.com/allen-li1231/treehop-rag
Arxiv: https://arxiv.org/abs/2504.20114

在人工智能領(lǐng)域，多跳問答（Multi-hop Question Answering, MHQA）一直是一項極具挑戰(zhàn)性的任務(wù)。這類任務(wù)要求系統(tǒng)通過多步推理，從不同文檔片段中綜合信息才能得出答案。例如，回答“特朗普的祖父是誰？”這樣的問題，往往需要先檢索“特朗普的父親是弗雷德·特朗普”，再進一步查詢“弗雷德·特朗普的父親是誰”。然而，現(xiàn)有方法依賴大型語言模型（LLM）反復重寫查詢，導致計算成本高昂、延遲顯著。近期，一項名為TreeHop的研究提出了一種全新的解決方案，通過嵌入空間的動態(tài)更新，實現(xiàn)了99%的延遲降低與5%-0.4%的模型參數(shù)量，為高效多跳推理開辟了新路徑。

TreeHop：無需大語言模型的高效多跳問答新范式-AI.x社區(qū)

1. 傳統(tǒng)方法的瓶頸：LLM依賴與效率困境

現(xiàn)有的檢索增強生成（RAG）系統(tǒng)通常采用“檢索-重寫-向量化-再檢索”的循環(huán)流程。例如，系統(tǒng)需用LLM根據(jù)首次檢索得到的文本生成新查詢，再重新編碼并檢索。這一過程雖能提升召回，但每次迭代均需調(diào)用LLM對原問題進行重寫（query rewrite），再使用sentence embedding模型映射到向量空間，導致計算資源消耗巨大，延遲過高，難以在工業(yè)場景中高效部署。

2. TreeHop的核心突破：嵌入空間的動態(tài)演化

TreeHop的創(chuàng)新在于完全摒棄LLM，直接在嵌入空間中完成多跳推理。其核心機制包括：

2.1. 動態(tài)嵌入更新的雙模塊協(xié)同

TreeHop通過query embedding與文檔塊嵌入的動態(tài)交互生成下一步查詢，其公式為：

TreeHop：無需大語言模型的高效多跳問答新范式-AI.x社區(qū)

其中：

**( q_r - c_r )**：通過減法抑制當前query與文檔塊的語義重疊，避免冗余檢索。例如，若當前文檔已確認“弗雷德是特朗普的父親”，從更高維的角度來理解，該操作會剔除query中與“弗雷德”相關(guān)的信息，確保下一跳聚焦于未解決的語義（如“弗雷德的父親”）。
UpdateGate：基于跨注意力機制（cross-attention），從文檔塊中提取query中沒有的新信息并融合到query中。例如，當檢索到“弗雷德是特朗普的父親”時，UpdateGate會捕捉“弗雷德”這一新事實，并將其補充到query embedding中，形成下一跳的查詢方向。

兩者的結(jié)合實現(xiàn)了“去冗余”與“信息增強”的協(xié)同：減法操作防止重復檢索，而加法操作引入新線索。

TreeHop：無需大語言模型的高效多跳問答新范式-AI.x社區(qū)

2.2. 雙重剪枝策略

冗余剪枝：若某文檔片段已在先前步驟中被檢索，則終止該路徑。
層級Top-K剪枝：每層僅保留相似度最高的K個候選，將檢索復雜度從指數(shù)級（如53=125）降至線性增長（如5*3=15）。

實驗表明，TreeHop在3個主流MHQA數(shù)據(jù)集（2WikiMultiHop、MuSiQue、MultiHop RAG）上，僅用0.06秒即可完成3跳檢索，召回率與LLM方案相當，部分場景甚至提升4.1%。

TreeHop：無需大語言模型的高效多跳問答新范式-AI.x社區(qū)

3. 工業(yè)應(yīng)用：低成本部署與實時響應(yīng)

TreeHop的技術(shù)突破為工業(yè)界提供了極具吸引力的解決方案：

成本效益：參數(shù)量僅為傳統(tǒng)方案的0.4%-5%，可于單塊Nvidia V100 GPU中訓練，顯著降低硬件投入。
實時性：99%的延遲縮減使其適用于客服系統(tǒng)、金融信息檢索等對多跳場景剛需，同時對響應(yīng)速度敏感的領(lǐng)域。
多語言支持：TreeHop基于BGE-m3模型的embedding訓練，可快速適配全球化業(yè)務(wù)需求，如跨境法律咨詢或跨地區(qū)醫(yī)療知識庫。

TreeHop：無需大語言模型的高效多跳問答新范式-AI.x社區(qū)

本文轉(zhuǎn)載自??大語言模型論文跟蹤??，作者：HuggingAGI

標簽

已于2025-5-7 09:49:27修改

贊

收藏

回復

舉報

回復

相關(guān)推薦

大模型微調(diào)新范式：當LoRA遇見MoE

zhangyannni ? 3506瀏覽 ? 0回復
多模態(tài)視覺-語言大模型的架構(gòu)演進

angel ? 4466瀏覽 ? 0回復
港大字節(jié)提出多模態(tài)大模型新范式，模擬人類先感知后認知，精確定位圖中物體

Crystalcxt ? 2375瀏覽 ? 0回復
AI Agent：人類工作范式的顛覆者還是人機協(xié)作新范式？

Baihai_IDP ? 4492瀏覽 ? 0回復
量化大模型退化嚴重？ETH北航字節(jié)推出LoRA新范式 | ICML 2024

Crystalcxt ? 2368瀏覽 ? 0回復
數(shù)據(jù)高效和計算高效全都要！中科大&微信等提出多模態(tài)大語言模型EE-MLLM

angel ? 2307瀏覽 ? 0回復
GMeLLo：結(jié)合知識圖譜的 LLM 多跳問答技術(shù)，效果顯著提升

大語言模型論文跟蹤 ? 3557瀏覽 ? 0回復
mPLUG-DocOwl2:新模型無需OCR，多頁文檔理解邁入新紀元

AI論文解讀 ? 3215瀏覽 ? 0回復
超越CLIP，視覺大模型訓練新范式？

kede96 ? 2113瀏覽 ? 0回復
多模態(tài)RAG-ColPali：使用視覺語言模型實現(xiàn)高效的文檔檢索

大模型自然語言處理 ? 2526瀏覽 ? 0回復
NLP范式總結(jié) | 擁抱新范式

zhcs333 ? 1942瀏覽 ? 0回復
M3DocRAG：文檔問答用哪個多模態(tài)大模型效果最好？

大語言模型論文跟蹤 ? 2630瀏覽 ? 0回復
南大聯(lián)合中移動發(fā)布高效多模態(tài)大模型新范式—— p-MoD

angel ? 2033瀏覽 ? 0回復
Search-R1：讓大模型學會“檢索+推理”的新范式

arnoldzhw ? 1231瀏覽 ? 0回復
大型語言模型的推理經(jīng)濟學：平衡性能與計算成本的新范式

頓數(shù)AI ? 1003瀏覽 ? 0回復
融合語言模型的多模態(tài)大模型研究

zhcs333 ? 1713瀏覽 ? 0回復
一文讀遍 LoRA 家族：大語言模型高效訓練的"秘密武器"

鴻煊的學習筆記 ? 1721瀏覽 ? 0回復
大模型應(yīng)用開發(fā)新范式：深入解讀MCP協(xié)議設(shè)計思想

AI博物院 ? 1425瀏覽 ? 0回復
無需標注數(shù)據(jù)！TTRL用“少數(shù)服從多數(shù)”解鎖大模型測試時強化學習新范式

arnoldzhw ? 771瀏覽 ? 0回復

大語言模型論文跟蹤

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

IKEA：通過強化學習提高LLM檢索規(guī)劃效率（開源） 2h前發(fā)布
ScaleMCP: 結(jié)合RAG技術(shù)增強MCP工具管理能力 2h前發(fā)布

熱門推薦

Hybrid-RRF：動態(tài)權(quán)重混合檢索RAG方案 0回復

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實戰(zhàn)教程 0回復

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

上一篇：微軟亞洲研究院打造最強視覺元素定位模型

下一篇： PaRT：小紅書團隊讓AI平均對話時長顯著提升21.77%

社區(qū)精華內(nèi)容

目錄

^{<sub id="pn9r3"></sub>}