RAG 企業級應用落地框架細節差異對比原創

發布于 2024-7-24 13:14

瀏覽

0收藏

RAG 檢索增強生成本質上來講，就三件事情：

RAG 企業級應用落地框架細節差異對比 -AI.x社區

第一、Indexing 索引。即如何更有效地存儲知識。

第二、Retrieval 檢索。即在龐大的知識庫中，如何篩選出少量的有益知識，供大模型參考。

第三、Generation 生成。即如何將用戶的提問與檢索到的知識相結合，使得大模型能夠生成有價值的回答。

這三個步驟表面上看似乎并不復雜，然而在 RAG 從構建到實際部署的整個流程中，包含了眾多精細且復雜的工作環節，這些落地細節是最具挑戰的工作。

RAG 企業級應用落地框架細節差異對比 -AI.x社區

雖然 RAG 架構基本上是按照這些模塊來設計的，但不同的實施方案在具體落地時各有其獨特之處。

下面詳細對比剖析。

網易 QAnything 的亮點在于 Rerank 模塊。

RAG 企業級應用落地框架細節差異對比 -AI.x社區

RAGFlow 的亮點在于數據處理模塊和知識索引構建模塊。

RAG 企業級應用落地框架細節差異對比 -AI.x社區

智譜 RAG 的亮點在于文檔解析、切片、Query 改寫及 Recall 模型的微調。

RAG 企業級應用落地框架細節差異對比 -AI.x社區

FastGPT 的優點是模塊動態配置靈活。

RAG 企業級應用落地框架細節差異對比 -AI.x社區

QAnything的此模塊使用了 PDF 文件解析，具體是通過 PyMuPDF 庫來完成的，該庫是目前效率最高的解析工具。在解析文檔內容時，無論是文本文件還是圖像文件，均使用 PyMuPDF 的 get_text 方法。需要注意的是，如果圖像文件中不包含文字，使用此方法時將會出現錯誤。
RAGFlow 的此模塊使用 OCR 和文檔布局分析等功能，在標準的 RAG（檢索增強生成）系統中通常被歸為一個不太顯眼的非結構化數據加載器部分。據此推測，RagFlow 的一個關鍵優勢很可能在于其文件解析的能力。
智譜 RAG--：
FastGPT--：

QAnything 向量庫使用了 Milvus 的混合檢索策略（結合 BM25 全文檢索和向量檢索），在檢索過程中不設定任何閾值，直接返回前 100 個最相關的結果（TopK =100）。
RAGFlow 向量數據庫選用了 ElasticSearch 進行操作。它實現了文本檢索與向量檢索的混合模式，盡管未明確指定所用的向量模型，但在文本檢索方面，使用了 “huqie” 作為分詞工具。
智譜 RAG混合檢索結合語義和全文檢索，利用 BGE-M3 向量模型，不直接通過向量或文本檢索召回數據，而是使用 RFF 算法進行排序。
FastGPT文章結構切片和遞增索引策略有效解決了問題。四種數據構建方案表現佳：

并對 Embedding 模型進行微調。

QAnything 精確排序使用自定義的 Rerank 模型，閾值設定為 0.35。
RAGFlow 重排排序結合了文本匹配得分和向量匹配得分，其中文本匹配的默認權重為 0.3，向量匹配的權重為 0.7。
智譜 RAG支持重排功能，可動態調整設置；整合嵌入向量（Embedding）與全文搜索（FullText）的結果，并按 ID 進行去重處理；對問答（QA）字符串進行拼接，移除其中的空格和標點符號，并對處理后的字符串進行哈希編碼以實現去重；若已配置重排序（Rerank）模型，則調用該模型對結果進行重新排序，并在評分（Score）中新增重排序得分；若未配置，則評分中不會包含重排序得分。
?FastGPT--：

QAnything 將所有數據集合并至一個提示詞（Prompt），并對最大 token 長度進行了優化處理。
RAGFlow 對大模型可處理的 token 數量進行限制篩選。
智譜 RAG--。
?FastGPT在模型微調過程中，我們采取了分步驟的策略：起初使用公開可用的通用問答數據集進行初步微調，隨后利用特定領域的問答數據進行進一步微調，最終使用經過人工精確標注的高質量問答數據來進行細致的微調。