成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

RAG檢索全攻略:Embedding與Rerank模型的終極指南

人工智能
Embedding Model與Rerank Model在RAG系統(tǒng)中相輔相成,分別承擔著“海選”和“精挑細選”的重要職責。選擇合適的Embedding Model可以提升系統(tǒng)的召回質(zhì)量,而搭配強大的Rerank Model則能進一步優(yōu)化結(jié)果的相關(guān)度和準確性。

在構(gòu)建基于檢索增強生成(RAG)的系統(tǒng)時,Embedding Model和Rerank Model扮演著至關(guān)重要的角色。比如你正在搭建一個智能搜索引擎,Embedding Model就像是幫你快速找到相關(guān)書籍的“圖書管理員”,而Rerank Model則像是一位經(jīng)驗豐富的“資深書評人”,負責從一堆書里精準挑選出最符合你需求的那幾本。兩者配合,就像一對完美搭檔,確保RAG系統(tǒng)既能找到大量信息,又能精準提煉出最關(guān)鍵的內(nèi)容。

RAG這玩意兒聽起來高大上,其實就是個“外掛大腦”,能讓AI在回答問題時不光靠自己那點小聰明,還能從外部知識庫里撈點干貨出來。核心呢?就是Embedding(嵌入)和Rerank(重排序)。

下面我們逐步解析這兩類模型的作用、推薦模型及其部署方法。

Embedding Model簡介

Embedding Model的核心任務是將文本、圖像或其他數(shù)據(jù)類型轉(zhuǎn)化為密集向量(Dense Vector),這種向量形式便于快速檢索和相似度計算。RAG系統(tǒng)中,Embedding Model主要用于構(gòu)建知識庫并實現(xiàn)高效召回。

Embedding Model的原理(結(jié)合RAG)在RAG系統(tǒng)中,Embedding Model的工作原理可以歸納為以下步驟:

文本編碼:將文本片段轉(zhuǎn)換為向量(Embedding),該向量捕獲了文本的語義信息。

向量存儲:將這些Embedding向量存儲到如FAISS、Milvus、Qdrant等向量數(shù)據(jù)庫中。

查詢編碼:用戶輸入的查詢也會通過Embedding Model編碼成向量。

相似度檢索:利用向量相似度算法(如內(nèi)積、余弦相似度)在向量數(shù)據(jù)庫中檢索最接近的候選文檔。

RAG系統(tǒng)的整體效果很大程度上依賴Embedding Model的召回質(zhì)量,好的Embedding Model能夠在第一步就篩出高質(zhì)量候選文本,極大提升系統(tǒng)性能。

簡單理解Embedding:

這家伙就像是給文本辦了個“身份證”。我每次看到一段話,腦子里想的都是“怎么把它變成AI能懂的玩意兒?”Embedding就干了這事兒:把文字變成一串數(shù)字(向量),而且這串數(shù)字還能反映出文字的“靈魂”。比如,“貓”和“狗”在向量世界里靠得近,“汽車”就離得老遠。簡單來說,它就是個翻譯官,把人類語言翻譯成AI的數(shù)學語言。

在RAG里,我用Embedding把用戶的問題和知識庫里的文檔都變成向量,然后一比對,找出最像的幾個。這種“速配”靠的是啥?余弦相似度啊,歐幾里得距離啊這些數(shù)學小把戲。效率高,覆蓋廣,這就是Embedding。

Rerank Model簡介

Rerank Model的核心任務是在Embedding Model召回的候選文檔中,進一步篩選和重新排序,以確保最相關(guān)的內(nèi)容排在前列。Rerank Model通常使用更復雜的深度學習模型來更精準地捕獲文本間的語義關(guān)系。

簡單理解Rerank:

光靠Embedding粗篩還不夠,畢竟它有時候會給我撈一堆“歪瓜裂棗”。這時候,Rerank就上場了。這家伙是個挑剔的“二篩大師”,專門從Embedding挑出的Top-K候選里再精選出Top-N。

它不像Embedding那樣簡單粗暴地比向量,而是用更聰明的方式(比如交叉注意力機制)去算:“喂,這個文檔跟問題到底有多搭?”最后,它給我一個分數(shù),我就按分數(shù)高低重新排個序,挑出最靠譜的答案。

常用模型介紹

常用Embedding模型及使用場景分類:

圖片

常用Rerank模型及使用場景分類:

圖片

快速部署模型

本次我們使用Xinference來部署這些模型。

先簡單介紹一下Xinference。它是Xorbits團隊搞的一個開源推理框架,號稱能讓你“一行代碼換模型”,支持各種語言模型(LLM)、語音識別模型和多模態(tài)模型。部署方式也很靈活,云端、本地、甚至筆記本都能跑。聽起來挺好,對吧?但咱們得看看它具體能不能搞定這些Embedding和Rerank模型。

Xinference github 地址:

https://github.com/xorbitsai/inference

根據(jù)Xinference的GitHub頁面和文檔,它主打的是:

開源語言模型:比如LLaMA、Mistral、Grok。

嵌入模型(Embedding Models):明確提到支持,像BAAI/bge-large-en、sentence-transformers/all-MiniLM-L6-v2這種。

Rerank模型:也支持,比如BAAI/bge-reranker-large。

所以,從官方宣稱來看,Embedding和Rerank模型都可以部署。尤其是BGE系列(包括bge-large-zh、bge-reranker-large),文檔里直接點名支持,說明這些熱門模型已經(jīng)適配好了。

本次我們使用Docker進行部署Xinference,執(zhí)行如下命令拉取鏡像:

docker pull xprobe/xinference

執(zhí)行如下命令運行Xinference:

docker run --name xinference -d -p 9997:9997 -e XINFERENCE_HOME=/data -v </on/your/host>:/data --gpus all xprobe/xinference:latest xinference-local -H 0.0.0.0

詳細操作可參考官方文檔。

Xinference 絕對能部署前面提到的絕大多數(shù)模型,尤其是BGE、SBERT、Cross-Encoder這種熱門模型,基本是“開箱即用”。BERT、Chinese-RoBERTa這種需要點手動配置,但也在能力范圍內(nèi)。

Embedding Model與Rerank Model在RAG系統(tǒng)中相輔相成,分別承擔著“海選”和“精挑細選”的重要職責。

選擇合適的Embedding Model可以提升系統(tǒng)的召回質(zhì)量,而搭配強大的Rerank Model則能進一步優(yōu)化結(jié)果的相關(guān)度和準確性。

無論是構(gòu)建知識庫、智能問答系統(tǒng),還是搜索引擎,合理地組合這兩類模型,才能充分發(fā)揮RAG系統(tǒng)的強大潛力。

責任編輯:龐桂玉 來源: 寫代碼的中年人
相關(guān)推薦

2025-06-24 08:52:54

2025-05-28 01:25:00

RAG人工智能語言模型

2009-02-12 10:12:00

NAT配置

2025-04-08 03:22:00

2010-04-23 14:04:23

Oracle日期操作

2025-04-21 08:19:36

2024-05-07 09:01:21

Queue 模塊Python線程安全隊列

2013-06-08 11:13:00

Android開發(fā)XML解析

2013-04-15 10:48:16

Xcode ARC詳解iOS ARC使用

2010-09-14 10:08:41

Squid安裝

2009-02-20 11:43:22

UNIXfish全攻略

2016-08-28 14:44:42

算法TSP生物智能

2014-03-19 17:22:33

2009-12-14 14:32:38

動態(tài)路由配置

2009-10-19 15:20:01

家庭綜合布線

2024-09-10 08:26:40

2013-05-22 10:00:30

iOSWeb Appicon

2010-03-12 15:00:52

Python中

2010-05-20 19:22:22

2009-01-05 15:58:00

Java認證報考指南
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 日韩中文字幕在线播放 | 久久国产欧美日韩精品 | 99久久精品国产一区二区三区 | 日本综合在线观看 | 中文字幕视频在线观看免费 | 久久精品影视 | 国产精品国产精品国产专区不卡 | 午夜欧美日韩 | 奇米影视首页 | 国产精品久久久久久影视 | 色综合久久久久 | 久久久影院 | 日韩精品在线视频免费观看 | 成人精品鲁一区一区二区 | 国产午夜精品视频 | 国产激情视频网站 | 国产成人精品免费视频大全最热 | 国产精品欧美一区二区三区不卡 | 久久九九免费 | 久久国产精品-国产精品 | 一区二区日韩 | 成人av片在线观看 | yiren22综合网成人 | 久久久久久美女 | 91电影 | 国产三级电影网站 | caoporn国产精品免费公开 | 91精品国产91久久久久久 | 一级毛片免费视频 | 欧美日韩视频在线第一区 | 中文字幕亚洲一区二区三区 | 亚洲欧美一区二区三区国产精品 | 91av在线免费观看 | 九九亚洲精品 | 亚洲福利 | 日日夜夜草 | 免费一区| 天天操夜夜拍 | 日韩一级免费电影 | 欧美13videosex性极品 | 久久久久久国产精品久久 |