大模型面經—RAG工程實踐經驗總結原創

shizhi02

發布于 2024-10-24 13:29

瀏覽

0收藏

?RAG工程經驗面經總結。

雖然RAG工程整體有很多論文、算法和方法論，但在實際使用過程中，當數據量大了RAG很容易出現不可控的問題，本篇就針對實踐過程中遇到的問題總結面經進行分享，看看能不能給大家提供一些幫助。下面是一個快捷目錄。

一. RAG如何去優化索引結構？

二. 當混合檢索以及基于不同大小的chunk去檢索效果都不太好的時候，如何優化？

三. 如何通過rerank去提升RAG效果的，有哪些方案？

下面是答案。

一. RAG如何去優化索引結構？

1. 優化被檢索的embedding

1）微調被檢索的embedding

目的：讓被檢索的內容與query之間的相關性更加緊密

特別是術語更新較快且比較罕見的領域，可以針對性地進行微調。

2）動態embedding

目的：基于上下文動態調整embedding

當然這只是個發論文的思路，工程落地的時候這塊還是有待驗證的。

3）檢索后處理流程優化

目的：直接把所有檢索結果給大模型可能會超出上下文窗口限制，內容過多噪聲也可能比較多。

優化方法：

ReRank
Prompt 壓縮
RAG 管道優化
混合搜索
遞歸檢索與查詢引擎
StepBack-prompt 方法
子查詢
HyDE 方法

2. 優化query的chunk大小

chunk大小非常關鍵，決定了從向量存儲中檢索的文檔的長度。小塊可能導致文檔缺失一些關鍵信息，而大塊可能引入無關的噪音。找到最佳塊大小是要找到正確的平衡。

目前來說一般是按不同塊大小劃分驗證集做實驗，直接用驗證集效果說話。

3. 結合不同粒度信息進行混合檢索

雖然向量搜索有助于檢索與給定查詢相關的語義相關塊，但有時在匹配特定關鍵詞方面缺乏精度。根據用例，有時可能需要精確匹配。

混合檢索就是結合embedding搜索和關鍵詞搜索。

二. 當混合檢索以及基于不同大小的chunk去檢索效果都不太好的時候，如何優化？

這種情況就要針對具體的case關注知識庫里是否有答案了。

如果有答案但是沒檢索出來，那么大概率可能答案被錯誤分割開了，那么可以結合一些小模型（BERT等）拿來做上下句預測；

另外也可以分析 query 和 doc 的特點：字相關還是語義相關，一般建議是先用推薦系統經典的ES做召回，然后才用模型做精排

三. 如何通過rerank去提升RAG效果的，有哪些方案？

背景：當檢索時，前K個結果不一定按最相關的方式排序。它們都是相關的，但在這些相關內容中，最相關的可能并不是第1或第2個，而是排名靠后的。rerank就是將最相關的信息重新定位到排名靠后的檢索結果。

這里推薦一些思路：

Diversity Ranker 根據文檔的多樣性進行重新排序；

LostInTheMiddleRanker 中提出LLM 會著重把注意力放在文本開頭和結尾的位置，那就把最需要讓 LLM 關注的 documents 放在開頭和結尾的位置。

另外還有一些經典的框架LlamaIndex、LangChain 和 HayStack都可以參考和直接用。

其實主要的思路都大同小異，實際工作中還是主要會結合具體的case來優化，大家有更多的問題和經驗也可以一起分享討論。

參考文獻

[1] Retrieval-Augmented Generation for Large Language Models: A Survey(arxiv.org/pdf/2312.10997)

[2] 論文分享|RAG理論-第一篇-概述 - 知乎(https://zhuanlan.zhihu.com/p/678616587)

[3] 提升RAG性能的關鍵技術：從數據清理到混合檢索的全方位討論 - 知乎(https://zhuanlan.zhihu.com/p/676463769)

文轉載自公眾號瓦力算法學研所，作者：喜歡瓦力的卷卷

原文鏈接：??https://mp.weixin.qq.com/s/xcGvL2WhgV2tKT3JdiF6GA???

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

RAG

面試干貨

贊

回復

舉報

回復

相關推薦

生成式AI大模型之提示詞工程實踐

數字化助推器 ? 3662瀏覽 ? 0回復
AIGC 和低代碼結合應用全棧研發實踐總結

卓勝微wjp ? 4527瀏覽 ? 0回復
解構復合人工智能系統（Compound AI Systems）：關鍵術語、理論、思路、實踐經驗

Baihai_IDP ? 4417瀏覽 ? 0回復
實踐出真知：Agents 領域“一年打怪升級”的經驗分享

Baihai_IDP ? 3859瀏覽 ? 0回復
RAG工程如何評測？

shizhi02 ? 3203瀏覽 ? 0回復
大模型面經——以醫療領域為例，整理RAG基礎與實際應用中的痛點

shizhi02 ? 3182瀏覽 ? 0回復
大模型面經——LoRA最全總結

shizhi02 ? 3053瀏覽 ? 0回復
大模型面經——Langchain總結

shizhi02 ? 2753瀏覽 ? 0回復
大模型面經——MoE混合專家模型總結

shizhi02 ? 3096瀏覽 ? 0回復
有了大模型的應用經驗之后，再談對大模型的理解

AI探索時代 ? 1791瀏覽 ? 0回復
大模型面經—分布式訓練指南

shizhi02 ? 2643瀏覽 ? 0回復
大模型面經—如何評估顯卡利用率及顯卡運用優化方法

shizhi02 ? 3102瀏覽 ? 0回復
長文 | 大模型Post-Training總結

NLP工作站 ? 2994瀏覽 ? 0回復
RAG范式演進及Agentic-RAG總結綜述

大模型自然語言處理 ? 3613瀏覽 ? 0回復
大模型面經：SFT和RL如何影響模型的泛化或記憶能力？

shizhi02 ? 2691瀏覽 ? 0回復
大模型面經：目前不同階段的scaling law之間的區別和聯系是什么？

shizhi02 ? 2966瀏覽 ? 0回復
大模型面經：RAG與Long context“相愛相殺”背景下，如何設計最優解決方案？

shizhi02 ? 1669瀏覽 ? 0回復
大模型面經——MLLM中模態對齊有哪些難點？有什么解決方法？

shizhi02 ? 834瀏覽 ? 0回復
LLM面經——多模態大模型訓練中”模態懶惰“問題如何解決？

shizhi02 ? 626瀏覽 ? 0回復

shizhi02

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂