成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

RAG檢索不過關(guān)?試試這些優(yōu)化策略,精準(zhǔn)度飆升!

人工智能
我們該怎么優(yōu)化 RAG 的檢索算法,讓它既精準(zhǔn)又高效呢?今天就來聊聊這個話題,帶你一步步解鎖 RAG 檢索的“進(jìn)階玩法”!

近來,RAG成了大語言模型的“救命稻草”,可讓大語言模型回答更準(zhǔn)確、更靠譜。可問題來了,很多 RAG 應(yīng)用的檢索系統(tǒng)還是有點(diǎn)“笨”:要么漏掉關(guān)鍵信息,要么抓回一堆無關(guān)緊要的“噪聲”,搞得最終答案質(zhì)量參差不齊。

那么,我們該怎么優(yōu)化 RAG 的檢索算法,讓它既精準(zhǔn)又高效呢?今天就來聊聊這個話題,帶你一步步解鎖 RAG 檢索的“進(jìn)階玩法”!

為什么非得優(yōu)化檢索算法不可?

RAG 的工作流程其實(shí)很簡單:

  • 用戶丟出一個問題(Query)
  • 系統(tǒng)去“翻箱倒柜”找相關(guān)文檔(Retriever)
  • 把文檔塞給 LLM,讓它生成答案(Generator)

聽起來挺順暢,對吧?但關(guān)鍵就在第二步——檢索。如果翻出來的文檔不靠譜,哪怕 LLM 再聰明,也只能“巧婦難為無米之炊”。所以,檢索算法就是 RAG 的命門,優(yōu)化它,才能讓整個系統(tǒng)“起飛”!

傳統(tǒng)檢索方法介紹

我們先來看看常見的檢索方法,各自有啥優(yōu)缺點(diǎn):

BM25(關(guān)鍵詞搜索)

優(yōu)點(diǎn):擅長精準(zhǔn)匹配,像查字典一樣適合結(jié)構(gòu)化數(shù)據(jù)。

缺點(diǎn):完全不理解語義,同義詞、變體詞一概不認(rèn),漏掉的信息可不少。

向量搜索(語義搜索)

優(yōu)點(diǎn):能“讀懂”句子意思,非常適合非結(jié)構(gòu)化數(shù)據(jù)。

缺點(diǎn):有時候太“腦洞大開”,抓回一堆似是而非的東西,誤召回讓人頭疼。

單獨(dú)靠 BM25 或向量搜索,總覺得差點(diǎn)火候。要不信息丟了,要不噪聲太多。所以,咱們得玩點(diǎn)更高級的——混合搜索(Hybrid Search)!

Hybrid Search簡介

混合搜索就是把 BM25 和向量檢索“捏”在一起,既能抓住關(guān)鍵詞,又能理解語義,簡直是“魚和熊掌兼得”。具體怎么操作呢?

第一步:BM25 出馬

根據(jù)關(guān)鍵詞鎖定一批相關(guān)文檔,精準(zhǔn)打擊!

第二步:向量搜索補(bǔ)刀

用 Embedding 計算語義相似度,再撈一批“深藏不露”的好文檔。

第三步:結(jié)果融合

加權(quán)融合:給 BM25 和向量搜索的分?jǐn)?shù)加個權(quán)重,算個平均值。

交集/并集策略:要么取兩者的“重合部分”(求穩(wěn)),要么全收下(求全),看需求靈活調(diào)整。

Reranker:給結(jié)果來個“大洗牌”

Hybrid Search 雖然厲害,但偶爾還是會混進(jìn)一些“雜牌軍”。這時候,Reranker 就該登場了!它的任務(wù)是把檢索結(jié)果重新排個序,讓最靠譜的文檔站到“C位”。

Reranker 怎么玩?

先用 BM25 和向量搜索召回一堆文檔。

然后請 Reranker 出馬,逐一打分,把最貼合問題的文檔頂?shù)角懊妗?/span>

Query Expansion:讓查詢更“會說話”

有時候,用戶的問題太簡短或模糊,檢索系統(tǒng)“摸不著頭腦”。這時候可以用 Query Expansion,幫查詢“充實(shí)”一下,提高召回率。

擴(kuò)展招式:

  • WordNet 同義詞擴(kuò)展:給關(guān)鍵詞找“兄弟姐妹”,適合 BM25。
  • LLM 生成擴(kuò)展:讓大模型直接改寫查詢,適合語義搜索。

錦上添花的優(yōu)化小技巧

除了上面的大招,還有幾招“小而美”的優(yōu)化方法:

  • MetaData 過濾:用文檔的時間、分類等元數(shù)據(jù),篩掉不相關(guān)的“路人甲”。
  • 動態(tài)調(diào)權(quán)重:在 Hybrid Search 里,根據(jù)場景調(diào)整 BM25 和向量搜索的比重。
  • 多輪對話優(yōu)化:讓用戶多聊幾句,提供更多上下文,查詢自然更精準(zhǔn)。

支持Hybrid Search的開源庫

目前,有許多支持 Hybrid Search 的開源庫,它們結(jié)合了 BM25 關(guān)鍵詞搜索 和 向量搜索,并支持各種后處理優(yōu)化(如 Reranking)。以下是幾款常見的 Hybrid Search 開源庫:

01.LlamaIndex

Github地址:

https://github.com/run-llama/llama_index

簡介:LlamaIndex 是一個流行的 RAG 框架,支持 Hybrid Search(BM25 + 向量檢索),并且能夠與 LLM 結(jié)合。

特點(diǎn):

  • 內(nèi)置 BM25 + 向量檢索融合(可調(diào)權(quán)重)
  • 支持 FAISS、Weaviate、Qdrant、ChromaDB 等
  • 支持 Reranker(如 Cohere Rerank)提升精準(zhǔn)度

02.Jina AI

Github地址:

https://github.com/jina-ai/serve

簡介:Jina AI 提供一個強(qiáng)大的 Hybrid Search 解決方案,支持結(jié)合 BM25 和向量搜索,并內(nèi)置多種 Reranker。

特點(diǎn):

  • 支持 FAISS、HNSW、Qdrant、Weaviate 等
  • 可結(jié)合 Reranker 提高搜索質(zhì)量
  • 可用于 RAG、推薦系統(tǒng)等場景

03.Weaviate

Github地址:

https://github.com/weaviate/weaviate

簡介:Weaviate 是一個企業(yè)級的向量數(shù)據(jù)庫,內(nèi)置 Hybrid Search,允許同時使用 BM25 + 向量搜索 進(jìn)行檢索。

特點(diǎn):

  • 支持 OpenAI、Hugging Face 的 Embedding
  • 內(nèi)置 BM25 搜索,可進(jìn)行關(guān)鍵詞匹配
  • 支持 GraphQL 查詢,可擴(kuò)展性強(qiáng)

04.Qdrant

Github地址:

https://github.com/qdrant/qdrant

簡介:Qdrant 是一個高性能的向量數(shù)據(jù)庫,支持 Hybrid Search,能夠結(jié)合 BM25 + 向量搜索 進(jìn)行檢索。

特點(diǎn):

  • 輕量級,適合本地或云端部署
  • 支持 REST API 和 Python SDK
  • 支持 Reranker

05.ElasticSearch

Github地址:

https://github.com/elastic/elasticsearch

簡介:ElasticSearch 結(jié)合 BM25 和 kNN 向量檢索,實(shí)現(xiàn) Hybrid Search,適用于企業(yè)級應(yīng)用。

特點(diǎn):

  • 支持 BM25 關(guān)鍵詞搜索 + kNN 語義搜索
  • 可與 OpenAI、Hugging Face 的 Embedding 結(jié)合
  • 適用于大規(guī)模數(shù)據(jù)檢索

圖片圖片

責(zé)任編輯:龐桂玉 來源: 寫代碼的中年人
相關(guān)推薦

2012-06-15 14:12:34

Google翻譯網(wǎng)站

2025-04-21 08:45:00

2024-09-24 14:32:17

RAG高級優(yōu)化Fusion

2023-05-04 10:41:58

2017-06-05 16:08:28

2022-03-31 10:14:00

界面設(shè)計師思路框架

2009-02-16 09:24:54

聯(lián)想PC質(zhì)量

2025-04-01 10:01:42

RAGCozeAI

2011-07-11 13:32:09

臺積電NVIDIA普勒性

2020-05-21 10:16:41

谷歌算法機(jī)器學(xué)習(xí)

2020-10-14 10:52:39

Spectrum系統(tǒng)AWG

2024-07-02 08:00:00

人工智能網(wǎng)絡(luò)安全

2024-09-21 17:55:53

2023-07-07 09:08:18

AI人工智能

2025-04-01 04:25:00

RAG數(shù)據(jù)檢索

2025-01-17 13:00:00

AI模型訓(xùn)練

2025-04-01 09:25:09

2025-04-29 09:15:49

AI數(shù)據(jù)模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产精品一区二区av | 精品久久久久久亚洲精品 | 九九色综合| 久久久亚洲综合 | 欧美一级二级视频 | 日韩中文在线观看 | 欧美精品一区二区在线观看 | 日韩在线小视频 | 国产97久久 | 亚洲精品久久 | 免费毛片网站在线观看 | 久久久999免费视频 999久久久久久久久6666 | av激情影院 | 黄色片亚洲 | 91精品国产综合久久久久 | 亚洲iv一区二区三区 | 国产精品亚洲第一区在线暖暖韩国 | 日韩中文字幕网 | 久久久亚洲一区 | 久久久网 | 日韩免费在线观看视频 | 国产一区二区三区四区五区加勒比 | 国产精品综合色区在线观看 | 成人综合在线视频 | 伦理午夜电影免费观看 | 亚洲91视频 | 羞羞在线观看视频 | 色婷婷精品国产一区二区三区 | 性网址| 一级一片在线观看 | 一区二区精品在线 | 殴美一级片| 在线观看视频一区 | 欧美一二三 | 国产成人精品一区二区三区视频 | 欧美日韩亚洲在线 | 国产一区视频在线 | 久久久99国产精品免费 | 亚洲一区 中文字幕 | 国产欧美日韩精品一区二区三区 | 欧美日韩中文字幕在线 |