成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<button id="11611"><option id="11611"></option></button>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

MRAG：一種多頭RAG，提升具有顯著不同內容的多個文檔復雜查詢的檢索準確性

發布于 2024-6-12 11:25

瀏覽

0收藏

現有的RAG方案沒有專注于需要檢索多個具有顯著不同內容的文檔的查詢，這類查詢經常出現，但挑戰在于這些文檔的嵌入可能在嵌入空間中距離很遠，難以全部檢索。

因此，提出一種多頭檢索增強生成方法（MRAG：Multi-Head RAG ），它的關鍵思想是利用Transformer解碼器的多頭注意力層的激活，而不僅僅是前饋層，來生成嵌入。不同的注意力頭可以捕獲數據的不同方面，因此使用這些激活產生的嵌入能更好地表示文檔和查詢的各個方面。

MRAG使用最后一個標記的每個注意力頭的輸出作為一組“單方面”嵌入。這些嵌入的完整集合形成了“多方面”嵌入。重要的是，這與僅使用最終解碼器層輸出的標準RAG相比，不需要額外的空間。

解碼器架構的概述，以及標準RAG和多頭RAG嵌入生成方式的比較。

MRAG：一種多頭RAG，提升具有顯著不同內容的多個文檔復雜查詢的檢索準確性-AI.x社區

MRAG（多頭RAG）流程的概述，由兩部分組成：數據準備A和查詢執行B。嵌入模型C和數據存儲D被這兩部分使用。數據存儲D包含指向反映三種不同方面（青色、品紅色、黃色）的文本塊的文本嵌入。帶有星號標記的塊是這項工作的新特點。

MRAG：一種多頭RAG，提升具有顯著不同內容的多個文檔復雜查詢的檢索準確性-AI.x社區

多頭檢索增強生成（Multi-Head RAG, MRAG）流程的概述：

數據準備（Data Preparation）：在數據準備階段，MRAG通過使用選定的基于解碼器的嵌入模型（decoder-based embedding model）來創建文本塊（text chunks）的多方面嵌入（multi-aspect embeddings）。這些嵌入隨后與相應的文檔或文本塊一起存儲在數據存儲（data store）中。MRAG支持不同類型的數據嵌入，包括文檔分塊、整文檔或其他類型的數據。
查詢執行（Query Execution）：在查詢執行階段，首先使用選定的嵌入模型為輸入查詢生成多方面嵌入。然后，使用特殊的多方面檢索策略在數據存儲中找到最接近的多方面嵌入及其對應的文本塊。最后，檢索到的數據可以選用新的度量標準進行評估，以確定其與多方面需求的對應程度。
多方面嵌入的存儲：與標準RAG不同，MRAG為每個多方面嵌入包含h個單方面嵌入，每個嵌入指向原始文本塊。數據存儲包含h個嵌入空間，每個空間捕獲文本的不同方面。這使得MRAG能夠在多個嵌入空間中比較查詢和文本塊，這些空間捕獲數據的多個方面。
多方面檢索策略：MRAG的檢索策略包括三個步驟：在數據準備期間為所有h個嵌入空間分配重要性得分；在查詢執行期間，MRAG首先為每個嵌入空間單獨應用傳統RAG檢索，返回每個嵌入空間的c個最近文本塊的列表；然后使用預計算的重要性得分通過投票策略從所有hc個塊中選擇整體前k個。
與數據存儲的集成：MRAG可以與不同類型的數據存儲和最近鄰（Nearest Neighbor, NN）搜索方法無縫使用。它可以結合精確和近似的最近鄰搜索來找到匹配的（嵌入，塊）對。?

用于評估不同RAG策略的示例查詢。文本中要獲取的文檔，然后評估不同RAG策略在找到這些文檔及其類別方面的成功率。標記了精確文檔匹配、類別匹配、多次匹配類別的文檔，以及沒有匹配文檔的文本段。最后，展示了每種策略的加權成功率，采用2:1的加權（優先考慮精確文章匹配）。

MRAG：一種多頭RAG，提升具有顯著不同內容的多個文檔復雜查詢的檢索準確性-AI.x社區

提供了評估方法和指標、合成數據集和現實世界用例來展示MRAG的有效性，顯示出在相關性方面比標準RAG基線提高了高達20%。

MRAG（多頭RAG）和標準RAG在25個查詢中的檢索成功率比較，每個查詢包含10個不同的方面。上半部分展示了精確文檔匹配，而下半部分展示了僅類別匹配（我們在第3節中解釋了使用的度量標準）。為了展示25個查詢中詳細的分布情況，為一個特定樣本呈現了直方圖（每個查詢獲取的文檔數量為30）。MRAG在精確文檔匹配的檢索成功率上一貫優于標準RAG（平均提高了超過10%）。在類別匹配上的檢索性能提升更為顯著（平均提高了超過25%的檢索成功率）。

MRAG：一種多頭RAG，提升具有顯著不同內容的多個文檔復雜查詢的檢索準確性-AI.x社區

MRAG相對于標準RAG在不同數量方面和不同嵌入模型的查詢中的相對檢索改進10-20%（左側為SFR，右側為e5）。

MRAG：一種多頭RAG，提升具有顯著不同內容的多個文檔復雜查詢的檢索準確性-AI.x社區

在多方面數據集、法律數據集和事故數據集上的實驗表明，MRAG在檢索成功率上優于標準RAG和Split RAG。

在構建法律文件（左）和發現工業事故原因（右）這兩個真實世界工作負載中，MRAG和Split RAG相對于標準RAG在檢索成功率上的平均提升。

MRAG：一種多頭RAG，提升具有顯著不同內容的多個文檔復雜查詢的檢索準確性-AI.x社區

通過對不同解碼器塊的嵌入和不同投票策略的分析，證明了MRAG設計和選擇的合理性。

對MRAG和Split RAG的不同投票策略的評估

MRAG：一種多頭RAG，提升具有顯著不同內容的多個文檔復雜查詢的檢索準確性-AI.x社區

https://arxiv.org/html/2406.05085v1
https://github.com/spcl/MRAG
Multi-Head RAG: Solving Multi-Aspect Problems with LLMs

本文轉載自??PaperAgent??

標簽

贊

收藏

回復

舉報

回復

相關推薦

LLM4CS：一種利用LLM提升多輪會話檢索的效果的方案

arnoldzhw ? 1.1w瀏覽 ? 0回復
Transformer頻域消偏提升時序預測準確性

海因斯DK ? 4417瀏覽 ? 0回復
DeepMind | 在生成的過程中進行檢索：一種有潛力完全替代RAG的思路"RICHES"

arnoldzhw ? 4509瀏覽 ? 0回復
QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率

大語言模型論文跟蹤 ? 3282瀏覽 ? 0回復
Agentic RAG Golden-Retriever：顯著提升企業知識庫問答準確性、檢索效率！

PaperAgent ? 3310瀏覽 ? 0回復
介紹一種實用的RAG技術：父文檔檢索（PDR）

51CTO內容精選 ? 2888瀏覽 ? 0回復
一種支持4種多模態RAG技術的引擎：VARAG

PaperAgent ? 3691瀏覽 ? 0回復
改進RAG管道檢索文檔質量的五種方法

51CTO內容精選 ? 2829瀏覽 ? 0回復
RAG 的未來 - 自動文檔檢索

探索AGI ? 2512瀏覽 ? 0回復
VisRAG：清華大學&面壁智能提出了一種新的RAG思路，效果提升明顯

大語言模型論文跟蹤 ? 2949瀏覽 ? 0回復
RAG：如何通過實時數據提升AI準確性并減少“幻覺”

Halo咯咯 ? 8974瀏覽 ? 0回復
R2AG:將檢索信息融入RAG，提升問答系統準確性

大模型自然語言處理 ? 2228瀏覽 ? 0回復
HtmlRAG：利用 HTML 結構化信息增強 RAG 系統的知識檢索能力和準確性

Halo咯咯 ? 3869瀏覽 ? 0回復
使用MCTS顯著提升LLM在復雜任務的推理能力

arnoldzhw ? 6802瀏覽 ? 0回復
HiQA：一種用于多文檔問答的層次化上下文增強RAG

大模型自然語言處理 ? 2463瀏覽 ? 0回復
LightRAG：提升檢索增強生成的效率與準確性

Halo咯咯 ? 4622瀏覽 ? 0回復
RARE: 提升LLM推理準確性和事實完整性的檢索增強框架思路淺嘗

大模型自然語言處理 ? 2871瀏覽 ? 0回復
九種不同類型的檢索增強生成 (RAG)

Halo咯咯 ? 3062瀏覽 ? 0回復
EDC2-RAG：利用聚類和壓縮技術提升RAG準確性

大語言模型論文跟蹤 ? 2061瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

Doc2X：為知識庫RAG接上高精度文檔解析的“智能引擎” 8天前發布
RAG-Anything：全面的一體化多模態文檔處理 RAG 系統 8天前發布

熱門推薦

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統OneRec！ 0回復

上一篇： HippoRAG：協同LLM、KG與PPR的新型開源檢索框架，R@5比RAPTOR提高28%

下一篇： RAG全景圖：從RAG啟蒙到高級RAG之36技，再到終章Agentic RAG！

社區精華內容

目錄

主站蜘蛛池模板：免费观看av | 成人一区在线观看 | 久久看片| 中文字幕不卡在线观看 | 在线视频a| 欧美日韩一区精品 | 欧美男人天堂 | 精品一区国产 | 超碰在线亚洲 | 完全免费av在线 | 欧美精品91爱爱 | 色香蕉在线 | 日韩一区二区三区在线观看 | 91精品国产91 | 天天精品综合 | 久久综合一区二区三区 | 日韩在线视频一区 | 亚洲午夜av | 一本综合久久 | 日韩中文字幕免费在线 | 中文字幕在线视频观看 | 中文字幕乱码一区二区三区 | 成人在线视频一区 | 日韩伦理一区二区三区 | 国产一区二区毛片 | 亚洲自拍偷拍视频 | 一级在线观看 | 精品三区| 久久久免费精品 | 超碰最新在线 | 亚洲一区中文字幕 | 欧美日韩在线一区二区三区 | 久草免费在线视频 | 成人一区二区三区在线观看 | 亚洲小视频在线播放 | 午夜看电影在线观看 | 我要看免费一级毛片 | 成人av免费 | 久久久久国产精品午夜一区 | 伊人精品一区二区三区 | 日本高清中文字幕 |