成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG 原創

發布于 2025-6-5 06:14
瀏覽
0收藏

給定一個問題Q,基于圖的RAG的關鍵思想是從圖中檢索相關信息(例如,節點、子圖或文本信息),將其與Q一起作為提示,然后輸入到LLM中。如下圖:

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

因此,現有工作的工作流主要包括兩個階段:

(1) 離線索引:從給定語料庫D構建知識圖譜G(V,E),其中每個頂點代表一個實體,每條邊表示兩個實體之間的關系,并基于知識圖譜構建索引。

(2) 在線檢索:使用索引從知識圖譜中檢索相關信息(例如節點、子圖或文本信息),并將檢索到的信息提供給大型語言模型以提高響應的準確性。

基于KG的RAG代表性的工作有GraphRAG等,如下表總結:

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

基于KG的RAG代表性的工作

傳統的GraphRAG影響性能的主要因素歸結如下表:

問題

描述

社區質量低

使用Leiden算法檢測社區,僅依賴圖結構,忽略節點和邊的語義信息,導致社區包含不同主題,摘要質量差,影響性能。

兼容性有限

全局搜索和局部搜索策略僅在單一粒度上檢索圖元素,無法同時處理抽象和具體問題,限制現實世界場景適用性。

生成成本高

在抽象問題上表現良好,但分析大量社區耗時且資源密集。例如,在Multihop-RAG數據集檢測到2,984個社區,回答100個問題需約$650和1.06億個token。

實體識別不準確

HippoRAG等方法在實體識別方面存在問題,5.0%的HotpotQA問題未能檢測到實體,15.8%的實體識別質量較低,導致不相關檢索結果。

檢索過程不準確

基于圖的RAG方法在搜索中常返回不相關內容,例如GraphRAG局部搜索時檢索結果不準確,導致性能下降。

因此,ArchRAG改進的方向主要可以集中在通過改進社區檢測和檢索策略來解決這些問題。下面來看看,僅供參考。

ArchRAG方法

同樣的,ArchRAG分為兩個階段:離線索引(重點)和在線檢索。如下圖:

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

ArchRAG框架

離線索引階段
  • KG構建:與GraphRAG一樣,使用LLM從文本語料庫中提取實體和關系,形成子圖并合并成一個完整的知識圖譜(KG)。
  • 層次化聚類:采用基于LLM的層次化聚類方法,檢測出高質量的屬性社區。這些社區不僅是節點密集連接的集合,還共享相似的語義主題。算法過程如下(重點看下該算法過程):

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

基于LLM的層次化聚類方法算法流程

  • C-HNSW索引構建:構建一個層次化的索引結構,用于高效檢索不同層次的ACs和實體。

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

C-HNSW索引構建算法

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

C-HNSW索引構建算法流程

在線檢索階段

層次化搜索:在C-HNSW索引上進行高效的層次化搜索,檢索出與查詢相關的ACs和實體。

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

層次化搜索算法過程

  • 自適應過濾生成:利用LLM的內在推理能力來提取和分析相關信息,從檢索到的信息中提取最相關的部分,生成最終的答案。

實驗性能

ArchRAG在特定QA任務上的表現優于現有的圖基RAG方法,特別是在準確性方面提高了10%。

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

ArchRAG在令牌使用上比GraphRAG節省了高達250倍,顯著提高了查詢效率。

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

通過結合KNN或CODICIL與加權Leiden算法,提高了社區檢測的質量。

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

回答示例:

改進社區檢測和檢索策略大幅提升GraphRAG性能新框架-ArchRAG-AI.x社區

參考文獻:paper:ArchRAG: Attributed Community-based Hierarchical Retrieval-Augmented Generation [Technical Report],https://arxiv.org/pdf/2502.09891v2

code:https://github.com/sam234990/ArchRAG


本文轉載自??大模型自然語言處理??   作者:余俊暉

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-6-5 06:14:18修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 亚洲视频在线观看免费 | 国产精品jizz在线观看老狼 | 国产精品久久久一区二区三区 | 亚洲高清免费观看 | 亚洲欧美一区二区三区1000 | 三级在线免费观看 | 二区三区视频 | 性色视频 | 五月婷婷丁香 | 亚洲国产成人av | 欧美日韩综合视频 | 91av在线免费看 | 欧美日韩成人一区二区 | 91久久精品国产免费一区 | 亚洲区视频 | 中文字幕一区二区三区日韩精品 | 国产成人精品一区二区三区在线 | 中文字幕黄色大片 | 国产激情毛片 | 在线看av网址 | 日本精品一区二区三区四区 | 久久出精品 | av大片| 国产综合区| 欧美亚洲国产日韩 | 欧美男人天堂 | 黄色精品| 欧产日产国产精品视频 | 麻豆久久| 日日干日日操 | 国产特黄一级 | 国产精品一区二区久久久久 | 欧美日韩在线观看一区二区三区 | 久久99精品久久久久久琪琪 | 黄色三级免费 | 成人九区 | 成人精品免费视频 | 成人在线一区二区三区 | 国产免费xxx | 亚洲免费在线播放 | 久久伊人精品 |