成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架

發(fā)布于 2024-6-17 09:34
瀏覽
0收藏

1. DR-RAG有多厲害?

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)圖片

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)圖片

上面兩個表分別展示了DR-RAG與其他幾個當(dāng)前流行的RAG框架對比的效果,特別是Adaptive RAG。可以看到,在多個測試數(shù)據(jù)集上,DR-RAG要比其他框架(比如:Adaptive RAG和Self RAG)準(zhǔn)確率都要更高。而且在相同TopK參數(shù)的前提下,DR-RAG的召回率更高,從而回答正確的比例也越高。

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)圖片

上面這個圖展示了DR-RAG與Adaptive RAG對比的一些例子,從例子里可以看出,DR-RAG在一些問題上,比Adaptive RAG回答的更準(zhǔn)確。

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)圖片

比如上面這個圖里的例子,傳統(tǒng)檢索器能夠輕松地獲取高相關(guān)性的靜態(tài)文檔(用紅色標(biāo)出),卻難以捕獲那些雖然相關(guān)性不高(用藍(lán)色標(biāo)出),但對于問題答案至關(guān)重要的動態(tài)文檔。

靜態(tài)相關(guān)文檔(Static-Relevant Documents,SRD):對答案生成至關(guān)重要且緊密相關(guān)的文檔。

動態(tài)相關(guān)文檔(Dynamic-Relevant Documents,DRD):相關(guān)性不高,但對答案生成同樣關(guān)鍵的文檔。

對于 “誰是彼得·安德烈亞斯·海伯格孩子的妻子?”這個問題,與“彼得·安德烈亞斯·海伯格”和“孩子/兒子”高度相關(guān)的靜態(tài)相關(guān)文檔(上圖以紅色標(biāo)出)較容易被檢索。然而,動態(tài)相關(guān)文檔(以藍(lán)色標(biāo)出)由于只與查詢中的“配偶/妻子”相關(guān),因此難以被檢索。

知識庫中關(guān)于“配偶”的信息可能非常多,導(dǎo)致這些動態(tài)相關(guān)文檔在檢索過程中排名較低。在靜態(tài)和動態(tài)相關(guān)文檔之間,“約翰·路德維格·海伯格”與“妻子”之間的聯(lián)系非常緊密。如果將查詢中的“配偶/妻子”也納入考慮,便能輕松地檢索到動態(tài)相關(guān)文檔,從而得出答案。

2. 什么是DR-RAG?

DR-RAG是指:Dynamic Relevant Retrieval-Augmented Generation,動態(tài)相關(guān)檢索增強(qiáng)生成。該方法是由理想汽車團(tuán)隊(duì)與中山大學(xué)、東北大學(xué)和四川大學(xué)等共同提出的一種新方法。

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)圖片

第一部分的例子,我們看到了DR-RAG擅長回答的問題類型:發(fā)現(xiàn)相關(guān)性不高,但是對回答問題很重要的文檔。之所以DR-RAG如此厲害,是因?yàn)镈R-RAG采用了一種兩步檢索框架,用于挖掘查詢和文檔之間的相關(guān)性。

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)圖片

如上圖:

? 第一步,根據(jù)與查詢的高相關(guān)度檢索靜態(tài)相關(guān)文檔(SR-Documents)。

? 第二步,將這些靜態(tài)文檔與查詢結(jié)合,以檢索一系列動態(tài)相關(guān)文檔(DR-Documents)。

? 最終,逐一挑選DR-Documents,將其與查詢及靜態(tài)文檔串聯(lián),輸入分類器,以篩選出最具相關(guān)性的動態(tài)文檔。

遺憾的是,找遍了整篇論文,好像沒有找到有關(guān)這個分類器如何得到、如何復(fù)現(xiàn)的一些細(xì)節(jié)(也許是我漏掉了)

為了讓RAG回答問題更加準(zhǔn)確,需要盡可能給出與回答問題最重要的文檔;因此,我們必須檢索非常多文檔,以讓模型給出更加全面的回答。

DR-RAG的宗旨是從檢索到的文檔中篩選出最相關(guān)、最重要的文檔,并且確保不遺漏LLM回答問題所需的關(guān)鍵信息。而實(shí)際上,僅憑相似性匹配(SM)很難一網(wǎng)打盡所有靜態(tài)和動態(tài)相關(guān)的文檔。

通常,大家會通過推升K值來增加DRD的概率,比如:在MuSiQue系統(tǒng)中,將k值從3增至6,僅將召回率從58%提升至76%,依然有許多相關(guān)文檔未能被檢索。此外,不相關(guān)的文檔可能會給LLMs帶來冗余信息。

所以,DR-RAG實(shí)際上是在保持top-k不變的情況下,通過提升基于動態(tài)相關(guān)性的文檔召回率,來改善檢索效果。

3. 性能分析

3.1 召回率對LLM的影響

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)圖片

召回率對RAG和LLM至關(guān)重要。因?yàn)楫?dāng)召回率不高時,模型接觸的信息不完整、或者缺失,那么容易產(chǎn)生“幻覺”的模型則難以準(zhǔn)確回答問題。在2Wiki數(shù)據(jù)集中,DR-RAG在僅選擇前6個文檔時,已經(jīng)達(dá)到了98%的高回憶率。

3.2 冗余信息對LLM的影響

若上下文中的冗余信息得以減少,大型語言模型便能更透徹地理解查詢,減少誤解。隨著輸入模型的文檔數(shù)量增多,無效信息可能激增約三成,但模型在作答時卻難以辨識。模型或許會依賴這些冗余信息,給出錯誤的答案。

在RAG過程中,應(yīng)盡可能減少向模型提供冗余或不準(zhǔn)確的信息。

以2Wiki數(shù)據(jù)集為例,當(dāng)提供給模型的文檔數(shù)量k為4或6時,從CIS(Classifier Inverse Selection)過渡到CFS(Classifier Forward Selection),召回率的提升并不顯著,反而在評價指標(biāo)上有所降低。因此,作者提出了CFS方法,用來平衡信息的冗余度和相關(guān)性。

3.3 用更少的文檔來提升召回率

CFS策略在降低文檔數(shù)量的同時提高回憶率。在二次檢索過程中,由于所需文檔已被檢索,為每對查詢-文檔找到匹配項(xiàng)似乎成了不可能的任務(wù)。這導(dǎo)致實(shí)際檢索到的文檔數(shù)量可能少于預(yù)定的k。以HotpotQA數(shù)據(jù)集為例,當(dāng)k設(shè)為6,實(shí)際上平均只有5.35份文檔被提供給LLMs,這在一定程度上減少了無關(guān)信息的干擾。

CFS方法在減少實(shí)際檢索文檔數(shù)量的同時,與QDC(Query Documents Concatenation)方法相比,實(shí)現(xiàn)了更高的回憶率。CFS方法在三大評價指標(biāo)上均獲得了更高的分?jǐn)?shù),證明了其在減少冗余輸入的情況下,相比其他方法具有更卓越的檢索性能。

3.4 響應(yīng)速度優(yōu)化

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)圖片

相較于以往的RAG框架,DR-RAG在整體流程中實(shí)現(xiàn)了更優(yōu)的時間管理。其他RAG框架在獲取答案前可能需多次調(diào)用LLMs,造成高昂的計算開銷。實(shí)際上,優(yōu)化LLMs的推理時間在實(shí)際應(yīng)用中同樣重要。單次調(diào)用LLMs就需耗費(fèi)大量時間,多次調(diào)用則在時間成本上構(gòu)成巨大挑戰(zhàn)。

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)圖片

為此,作者設(shè)計一個小規(guī)模、參數(shù)較少的模型,以實(shí)現(xiàn)更高效的優(yōu)化策略,避免頻繁調(diào)用LLMs。如上表所示,與Adaptive-RAG相比,我們平均減少了74.2%的時間消耗。因此,DR-RAG在實(shí)驗(yàn)效率上的提升,以及在時間成本上的優(yōu)勢,使其在實(shí)際工程應(yīng)用中具有重要價值。

? 論文原文: https://arxiv.org/abs/2406.07348

DR-RAG:理想汽車最新RAG研究成果,準(zhǔn)確率和響應(yīng)時間遠(yuǎn)超其他RAG框架-AI.x社區(qū)

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 午夜一区二区三区在线观看 | 日韩中文字幕在线观看 | 午夜精品久久久 | 99久久婷婷国产综合精品电影 | 免费h视频 | 中文字幕免费在线 | 在线视频久久 | 日本三级电影在线看 | 日韩久久久久 | 高清av在线 | 国产成人在线视频 | 日本三级网站在线观看 | 色婷婷综合久久久中字幕精品久久 | 美女人人操 | 网址黄 | 亚洲国产一区视频 | 欧美大片一区 | 很很干很很日 | 男人的天堂久久 | 欧美日韩在线播放 | 国产精品久久久久久久 | 国产精品一区二区精品 | 久久久免费 | 国产一区二区在线免费播放 | 日韩精品 | 国产午夜精品理论片a大结局 | 日韩av成人 | 一区二区三区av | 国产成人精品一区二区三区在线观看 | 午夜三级在线观看 | 亚洲小说图片 | 国产精品久久久久久福利一牛影视 | 欧美老少妇一级特黄一片 | 欧美一区二区视频 | 日韩福利在线 | 国产农村妇女精品一区 | 久久国内精品 | 亚洲福利片 | 天堂色区 | 一区二区三区亚洲视频 | 日韩在线观看中文字幕 |