自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="nyoic"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

大模型超長窗口上下文與檢索增強(qiáng)生成——RAG 原創(chuàng)

發(fā)布于 2024-12-4 13:36

瀏覽

0收藏

“ 怎么解決大模型的記憶問題，以及保證結(jié)果的準(zhǔn)確性，目前還是大模型應(yīng)用中一個亟待解決的問題 ”

看過作者文章的人對RAG技術(shù)應(yīng)該有了初步的了解，但不知道是否了解大模型的窗口大??；即使沒有研究過大模型的窗口，但也應(yīng)該聽過每次大模型輸入的內(nèi)容是有限的；而這個有限就是因為大模型窗口的限制。

那么，大模型窗口與檢索增強(qiáng)的關(guān)系是什么樣的？怎么解決長對話問題，隨著大模型窗口的增加，RAG會死嗎？

大模型窗口與RAG

RAG——檢索增強(qiáng)這個技術(shù)就不在過多介紹了，如果對此不了解的可以看一下作者之前的文章，比如前幾天的??RAG與本地知識庫，向量數(shù)據(jù)庫，以及知識圖譜的聯(lián)系與區(qū)別??。

那么今天主要來介紹一下大模型窗口，以及其與RAG技術(shù)的區(qū)別。

什么是大模型的窗口？

對技術(shù)有了解的人應(yīng)該都知道，大模型是根據(jù)Token進(jìn)行計費的，所謂的Token就是不同模態(tài)的數(shù)據(jù)，轉(zhuǎn)化為向量之后的一種計算方式；而大模型的窗口全稱是大模型上下文窗口，簡單來說就是大模型一次能夠接受的Token的大小。

大模型超長窗口上下文與檢索增強(qiáng)生成——RAG-AI.x社區(qū)

大模型的窗口為什么如此重要？

原因就在于，大模型的窗口代表著大模型能夠處理數(shù)據(jù)的大小，窗口越大代表著能夠輸入到大模型的內(nèi)容越多，大模型能夠捕捉的上下文就越多，內(nèi)容就越全面，當(dāng)然效果相對就越好。

舉個栗子來說，假如你想讓大模型回答一些關(guān)于四大名著的問題，那么你直接把四大名著直接都輸入到大模型，這樣肯定就能得到更準(zhǔn)確，更好的回答；而如果你只是告訴大模型孫悟空三打白骨精的那一段，那么其它的問題大模型就無法回答了。

這就是大模型上下文窗口的作用，能夠增加大模型上下文理解的能力，原因就在于大模型沒有記憶能力。

但大模型的窗口真的是越大越好嗎？大模型的窗口是否能無限大？

大模型的窗口并不是越大越好，當(dāng)然更不可能無限大；原因在于，上下文窗口越長，對大模型理解能力要求越高；就類似于，讓一個小學(xué)生去看上下五千年，雖然小學(xué)生可能真的能看懂，但他對很多東西都理解得不深刻。

這樣就會導(dǎo)致一個問題，那就是大模型對長文本理解的不準(zhǔn)確，因此控制窗口大小，讓大模型找到自己理解的極限才是最好的。

因此，這也是為什么今年以來大模型的窗口一直在不斷的增長，因為越長的文本處理能力，代表著模型能力越強(qiáng)；但從目前來看，長上下文窗口依然存在很多問題，比如理解不全面，對算力消耗更高，響應(yīng)時間過長等等。

大模型超長窗口上下文與檢索增強(qiáng)生成——RAG-AI.x社區(qū)

為什么說大模型上下文窗口可能會直接導(dǎo)致RAG的死亡？

原因就在于，如果大模型的窗口真的可以無限大，而且大模型又能夠真正理解全部上下文，那么RAG就沒有了存在的意義；因為，直接把全世界所有的數(shù)據(jù)和資料全部塞進(jìn)大模型里，這樣大模型就真的無所不知了。

但既然大模型無法做到這一步，因此RAG就肯定有其存在的空間。

其實，歸根結(jié)底不論是上下午窗口，還是RAG，亦或者是長對話等等；所有的一切都是因為大模型不具備記憶能力，而想出的補(bǔ)償方法。所以，不論是上下文還是RAG，本身都是為了解決大模型的記憶問題，包括長期記憶和短期記憶。

那么，思考一個問題，長對話問題怎么解決？

其實長對話問題一般有兩個解決方案，就是上面的兩個上下文窗口和RAG；區(qū)別就是，上下文窗口是直接把所有歷史對話全部帶入到上下文中，讓大模型自己去理解。而RAG是把對話信息保存到外部數(shù)據(jù)庫中，然后每次對話都先檢索到與對話最相關(guān)的內(nèi)容，然后拼接到大模型的提示詞中。

當(dāng)然，還有其它的方案，但暫不在此次討論的范圍之中。

大模型超長窗口上下文與檢索增強(qiáng)生成——RAG-AI.x社區(qū)

當(dāng)然，長對話并不只是簡單的解決記憶問題，還一個重要因素就是準(zhǔn)確性；在一些特殊的業(yè)務(wù)場景下，比如醫(yī)療，任何輕微的差別都可能導(dǎo)致致命的錯誤；因此，大模型在醫(yī)療領(lǐng)域的應(yīng)用，怎么才能保證百分之百的準(zhǔn)確性，這是一個值得思考的問題。

現(xiàn)在大家對長文本和RAG都有了一定的了解，那么你認(rèn)為上下文和RAG，哪個才是大模型的最終選擇？

本文轉(zhuǎn)載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/ASTnRDYcTDxzNQzrlo96yQ??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2024-12-5 14:58:05修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

LLM超長上下文查詢-性能評估實戰(zhàn)

ermulong ? 2815瀏覽 ? 0回復(fù)
通過檢索增強(qiáng)生成(RAG) 增強(qiáng)LLM的實戰(zhàn)演練

51CTO內(nèi)容精選 ? 3342瀏覽 ? 0回復(fù)
百萬上下文RAG，Agent還能這么玩

ermulong ? 3337瀏覽 ? 0回復(fù)
LLM超長上下文查詢-性能評估實戰(zhàn)

ermulong ? 2642瀏覽 ? 0回復(fù)
面向大語言模型的檢索增強(qiáng)生成(RAG)技術(shù)：綜述

angel ? 4995瀏覽 ? 0回復(fù)
長上下文 還是 RAG？ Google:我全都要！

探索AGI ? 2210瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強(qiáng)生成（RAG）技術(shù)

玄姐聊AGI ? 2515瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強(qiáng)生成（RAG）技術(shù)

Halo咯咯 ? 1969瀏覽 ? 0回復(fù)
引入上下文檢索(Contextual Retrieval)：提升AI模型的精準(zhǔn)度與效率

Halo咯咯 ? 2254瀏覽 ? 0回復(fù)
再談大模型檢索增強(qiáng)生成——RAG

AI探索時代 ? 1984瀏覽 ? 0回復(fù)
基于Agent的金融問答系統(tǒng)：RAG的檢索增強(qiáng)之上下文重排和壓縮

一起AI技術(shù) ? 2047瀏覽 ? 0回復(fù)
HiQA：一種用于多文檔問答的層次化上下文增強(qiáng)RAG

大模型自然語言處理 ? 2018瀏覽 ? 0回復(fù)
LightRAG：提升檢索增強(qiáng)生成的效率與準(zhǔn)確性

Halo咯咯 ? 3812瀏覽 ? 0回復(fù)
RAG檢索增強(qiáng)生成和大模型微調(diào)的抉擇

AI探索時代 ? 2155瀏覽 ? 0回復(fù)
大模型檢索增強(qiáng)生成之向量數(shù)據(jù)庫的問題

AI探索時代 ? 2206瀏覽 ? 0回復(fù)
九種不同類型的檢索增強(qiáng)生成 (RAG)

Halo咯咯 ? 2539瀏覽 ? 0回復(fù)
繞過 RAG 實時檢索瓶頸，緩存增強(qiáng)生成（CAG）如何助力性能突破？

Baihai_IDP ? 1817瀏覽 ? 0回復(fù)
什么是檢索增強(qiáng)生成 (RAG)？

Halo咯咯 ? 1733瀏覽 ? 0回復(fù)
駁“RAG 已死”論：上下文窗口擴(kuò)展≠RAG 終結(jié)

Baihai_IDP ? 406瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

智能體開發(fā)框架Langgraph基礎(chǔ)流程和理論梳理 19h前發(fā)布
隨著大模型技術(shù)的發(fā)展——RAG技術(shù)有可能會被淘汰嗎？ 4天前發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復(fù)

上一篇：什么是AI Agent，以及怎么實現(xiàn)AI Agent?

下一篇：大模型長文本所面臨的主要問題

社區(qū)精華內(nèi)容

目錄