成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<rt id="u2w2s"><acronym id="u2w2s"></acronym></rt>

<rt id="u2w2s"><delect id="u2w2s"></delect></rt>

<bdo id="u2w2s"><source id="u2w2s"></source></bdo>

<tfoot id="u2w2s"><delect id="u2w2s"></delect></tfoot>

<rt id="u2w2s"><delect id="u2w2s"></delect></rt>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率

大語言模型論文跟蹤

發布于 2024-7-29 01:10

瀏覽

0收藏

1. 背景

大型語言模型（LLMs）在眾多語言任務中展現出非常不錯的效果，然而，LLMs中的幻覺現象正極大地削弱它們的可信度和實用性。一種解決大語言模型幻覺的方法是檢索增強生成（RAG），通過檢索文檔來提供基于檢索到文檔中的事實信息的更準確的用戶查詢答復。

大語言模型幻覺（Hallucination）是指大語言模型產生錯誤或者誤導性的信息。

然而，RAG并未完全根除幻覺，這樣因此激發大量研究來提高RAG的準確性。一個不完善的RAG系統，常常因為模糊不清的查詢而引發誤導，導致沒能準確捕捉到用戶的真實意圖。

最新有研究表明，使用LLMs對用戶查詢進行擴展可以提升相關文檔的檢索效果。查詢擴展是指在原始查詢中加入更多相關術語，使得用戶的查詢更易與相關文檔相連。查詢擴展主要分為兩大類：

? 基于檢索器的方法通過利用檢索結果來拓展查詢

? 基于生成的方法則是借助大型語言模型（LLMs）等外部數據來豐富查詢內容

其中：

? 偽相關反饋（Pseudo Relevance Feedback，PRF）通過自動根據排名靠前的文檔調整初始查詢，進一步優化搜索結果，無需用戶明確輸入。PRF通過假定頂部結果的相關性，增強了查詢，從而提升了后續檢索的精確度。

? Query2Doc 研究顯示，將LLM生成的內容融合到查詢中，其效果明顯優于傳統的檢索技術。但這種方法也存在風險，可能會引入不準確信息，與目標文檔的匹配度不高，并且容易受到LLM幻覺的影響。

? 基于檢索的方法則通過引入相關術語或短語，增強了搜索查詢的實效性，使查詢更加豐富和精準。

? CSQE利用LLM從檢索到的文檔中提取關鍵句子進行查詢擴展，生成適應任務的查詢，盡管這有時會使得查詢變得過長。當將CSQE擴展的查詢與BM25評估的結果以及通過交叉編碼器從BEIR重新排名的結果進行比較時，發現性能提升并不顯著。

為了解決以上問題，本文作者提出了一種精確查詢優化方法（Query Optimization using Query expAnsion，QOQA），利用前k個平均查詢-文檔對齊得分，借助LLMs來精煉查詢。這種方法既計算效率高，又能提升文檔檢索的精確性，減少誤導。在實驗中，這種方法能夠以平均1.6%的提升率，準確提取所需文檔。

2. 什么是 QOQA？

2.1 借助大型語言模型（LLM）優化查詢

為了提升查詢質量，采用大型語言模型（LLM）根據得分對查詢進行改寫擴展。

QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率-AI.x社區圖片

首先，輸入原始查詢，并通過檢索器獲取相關文檔。然后，將原始查詢與檢索到的頂級文檔合并，形成擴展查詢，并提交給LLM以產生一系列重新表述的查詢。

經過改寫的查詢將根據其與檢索文檔的契合度進行評估，相應的查詢-文檔對齊得分及其查詢文本將被存入查詢池。

QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率-AI.x社區圖片

上圖展示了提示詞模板，將提示模板更新為包含原始查詢、檢索文檔以及排名靠前的查詢改寫。為確保性能超越原始查詢，始終在模板中融入原始查詢信息。在后續的優化環節，會根據得分生成一個經過優化的查詢，并將其加入到查詢池中。

上圖中，黑色文字是對任務描述的提示詞。藍色文字是原始查詢以及與之相關的頂級檢索文檔。紫色文字是由LLM優化器生成的改寫后查詢及其評分。

2.2 查詢-文檔對齊得分計算

2.1 中提到了一個查詢-文檔對齊得分，該得分涉及三個得分：

? 基于稀疏檢索的BM25分數

? 基于密集檢索的密集分數

? 融合了稀疏與密集檢索的混合分數

混合分數如下圖公式：

QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率-AI.x社區圖片

文章看上去沒有介紹這個 α參數如何設置。

3. 效果對比

QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率-AI.x社區圖片

上表比較了不同文檔檢索模型在SciFact、Trec-Covid和FiQA數據集上的表現。在密集檢索方面，增強模型（QOQA變體）顯示出優越的性能。

特別地，QOQA（基于BM25評分）在SciFact數據集上以75.4分的優異成績領先，在Trec-Covid數據集上以79.2分的混合評分證明了其強大的性能。QOQA在多個數據集上一致的性能提升，凸顯了其在提升檢索效率方面的顯著效果。

QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率-AI.x社區圖片

如上表，由QOQA生成的改寫查詢相較于原始查詢，在精確度和具體性上更勝一籌。

QOQA方法產生的查詢能夠精準地包含“納米”或“分子證據”等關鍵詞匯，從而有效抓取最為貼切的文檔。這種對關鍵詞的精準把控確保了改寫查詢與答案文檔在詞匯上的更高重合度。因此，借助QOQA優化的查詢在檢索包含正確答案的文檔時顯示出了顯著的效果。

QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率-AI.x社區圖片

上表中可以看出，優化步驟對于搜索更佳的改寫查詢起到了促進作用。

缺少了擴展部分，整體性能尤其以BM25分數為標準，會有顯著的下降。

證明擴展部分在塑造高品質改寫查詢和提升文檔檢索效率方面發揮了不可或缺的作用。

本文轉載自??大語言模型論文跟蹤??，作者：HuggingAG

QOQA：利用TopK文檔進行查詢改寫，平均提升RAG 1.6% 準確率-AI.x社區

標簽

贊

收藏

回復

舉報

回復

相關推薦

MIT等首次深度研究「集成LLM」預測能力：可媲美人類群體準確率

duhorse ? 2645瀏覽 ? 0回復
ChatGPT能預測未來特定事件，準確率高達97%

Aceryt ? 3292瀏覽 ? 0回復
Mobile-Agent-v2：GPT4v + 多Agent提高40%準確率

大語言模型論文跟蹤 ? 5304瀏覽 ? 0回復
MRAG：一種多頭RAG，提升具有顯著不同內容的多個文檔復雜查詢的檢索準確性

PaperAgent ? 4292瀏覽 ? 0回復
DR-RAG：理想汽車最新RAG研究成果，準確率和響應時間遠超其他RAG框架

大語言模型論文跟蹤 ? 4097瀏覽 ? 0回復
87.8%準確率趕超GPT-4o登頂！谷歌DeepMind發布自動評估模型FLAMe

duhorse ? 2423瀏覽 ? 0回復
再看多模態RAG進行文檔問答的方案

大模型自然語言處理 ? 2664瀏覽 ? 0回復
ChunkRAG：比CRAG提升10個點準確率

大語言模型論文跟蹤 ? 2488瀏覽 ? 0回復
改個名字，數倍提升Function Calling準確率！

ermulong ? 2533瀏覽 ? 0回復
怎么提升向量數據庫的召回準確率

AI探索時代 ? 2881瀏覽 ? 0回復
HybGRAG：Hit@1 的平均相對提升率達到 51%的新思路

大語言模型論文跟蹤 ? 2323瀏覽 ? 0回復
Agentic Chunking拯救語義斷裂，實測RAG準確率飆升40%，LLM開發者必看！

AI博物院 ? 3498瀏覽 ? 0回復
Graph RAG 迎來記憶革命：“海馬體”機制如何提升準確率？

凝固的雨_1 ? 2875瀏覽 ? 0回復
MES-RAG：準確率提升 25%！

大語言模型論文跟蹤 ? 1430瀏覽 ? 0回復
EDC2-RAG：利用聚類和壓縮技術提升RAG準確性

大語言模型論文跟蹤 ? 2055瀏覽 ? 0回復
RAG 準確率告急？金融大佬 Mike Conover 親授：構建高保真知識智能體的實戰秘笈

凝固的雨_1 ? 2529瀏覽 ? 0回復
試試加個知識圖譜，準確率提升 60%！

Halo咯咯 ? 1045瀏覽 ? 0回復
清華大學新RAG框架：DO-RAG 準確率飆升33%！

大語言模型論文跟蹤 ? 2470瀏覽 ? 0回復
Agentic CoT 架構實現RAG回答準確率突破94%大關

AI博物院 ? 1575瀏覽 ? 0回復

大語言模型論文跟蹤

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

不懂RAG？看這一篇萬字長文就夠了 6天前發布
詳解 Minus AI：邁向AGI新紀元？ 2025-06-13 07:02:10發布

熱門推薦

不懂RAG？看這一篇萬字長文就夠了 0回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

上一篇： DSARE：當傳統NLP遇到LLM后的關系提取新思路

下一篇：亞馬遜 RAG 新突破：REAPER 技術開啟大型智能對話助手新境界

社區精華內容

目錄

主站蜘蛛池模板：欧美一区| 国产成人免费在线 | 99免费在线视频 | 日韩欧美在线免费观看视频 | 超碰人人人 | 国产9久 | 国产精品久久久久久模特 | 男女久久久 | 在线观看中文字幕 | 国产精品99久久久久久人 | 日韩精品二区 | 国产精品久久久久久久久图文区 | 免费在线观看成人 | 999久久久 | 国产免费xxx| 国产精品美女久久久久aⅴ国产馆 | 成人免费一区二区三区视频网站 | 国产精品美女www爽爽爽 | 国产精品久久久久影院色老大 | 色橹橹欧美在线观看视频高清 | 亚洲黄色一级 | 天天拍天天操 | 日日天天 | jav成人av免费播放 | 国产精品久久久久久久久久免费 | 欧美日韩电影在线 | 在线亚洲欧美 | 久久er精品 | 成人伊人网 | 久久成人免费观看 | 久久久精品综合 | 亚洲成人免费电影 | 嫩草国产| 亚洲一区二区三区免费 | 国产精品国产三级国产aⅴ中文 | 国产日韩精品视频 | 精品国产91乱码一区二区三区 | 天堂精品| 亚洲福利视频网 | 日本淫视频 | 一区二区三区视频 |

<bdo id="uq2wa"><tbody id="uq2wa"></tbody></bdo>

<bdo id="uq2wa"></bdo>

<rt id="uq2wa"><delect id="uq2wa"></delect></rt>

<rt id="uq2wa"></rt>

<strike id="uq2wa"></strike>

<strike id="uq2wa"></strike>