成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

盤點RAG中最容易犯的五個錯誤

人工智能
基于向量的檢索無疑是 RAG 成功的重要因素。向量嵌入非常適合映射文本的語義含義。它們也適用于不同大小的文本。你的查詢可能是一句話,但你的文檔存儲包含整頁文章?——向量搜索可以處理。

我大部分時間都在構(gòu)建和改進 Retrieval-Augmented Generation (RAG) 應(yīng)用。

我相信 RAG 可能是最受歡迎的 AI 應(yīng)用之一。它無處不在,從聊天機器人到文檔摘要。

圖片圖片

我也相信,由于各種原因,許多 RAG 應(yīng)用最終未能部署,其中很多并非技術(shù)原因。然而,我希望自己早知道一些技術(shù)方面的知識,以創(chuàng)建更有效的 RAG。

但這就是我們學(xué)習(xí)新事物的方式。沒有比構(gòu)建并失敗更好的工程學(xué)習(xí)方法了。

從我的失敗中,我學(xué)到了一些寶貴的經(jīng)驗教訓(xùn),這些經(jīng)驗對首次構(gòu)建 RAG 的人很有幫助。你不必重復(fù)我犯過的錯誤,這樣你就能更快前進。

那么,讓我們談?wù)劦谝粋€錯誤。

向量數(shù)據(jù)庫并非硬性規(guī)定

幾乎所有關(guān)于 RAG 的網(wǎng)絡(luò)教程都使用向量數(shù)據(jù)庫。如果你搜索過 RAG 相關(guān)內(nèi)容,你會明白我的意思。

基于向量的檢索無疑是 RAG 成功的重要因素。向量嵌入非常適合映射文本的語義含義。它們也適用于不同大小的文本。你的查詢可能是一句話,但你的文檔存儲包含整頁文章?——向量搜索可以處理。

然而,檢索并不僅限于基于向量的檢索。

RAG 可以從互聯(lián)網(wǎng)、關(guān)系數(shù)據(jù)庫、Neo4J 中的知識圖譜或三者的組合中檢索信息。

在許多情況下,我注意到混合方法能帶來更好的性能。

對于通用應(yīng)用,你可以使用向量數(shù)據(jù)庫,但當(dāng)向量數(shù)據(jù)庫中沒有所需信息時,你可以搜索互聯(lián)網(wǎng)。

對于客戶聊天機器人,你可能需要讓 RAG 訪問部分客戶數(shù)據(jù)庫,這可以是關(guān)系數(shù)據(jù)庫。

企業(yè)的知識管理系統(tǒng)可能會創(chuàng)建一個知識圖譜,并從中檢索信息,而不是使用向量數(shù)據(jù)庫。

這些都是 RAG 的定義。

然而,選擇數(shù)據(jù)源的過程并非直截了當(dāng)。你需要嘗試各種選項,了解每種方法的優(yōu)點。接受或拒絕一個想法的理由可能受技術(shù)和業(yè)務(wù)因素的影響。

例如,你可以為每個客戶簡介信息創(chuàng)建文本版本并進行向量化以供檢索。這對于查詢來說可能很高效,因為你只處理一個數(shù)據(jù)庫。但它的準(zhǔn)確性可能不如運行 SQL 查詢。這是技術(shù)原因。

然而,讓 LLM 運行 SQL 查詢可能導(dǎo)致 SQL 注入攻擊。這是技術(shù)和業(yè)務(wù)上的問題。

向量數(shù)據(jù)庫在語義檢索方面也很高效。但這并不意味著其他數(shù)據(jù)庫不能處理語義檢索;幾乎所有其他數(shù)據(jù)庫都可以進行向量搜索。

因此,如果你決定在 RAG 中使用某種形式的向量嵌入,這里還有一個建議。

優(yōu)先選擇經(jīng)過微調(diào)的小模型

嵌入模型可以將任何內(nèi)容轉(zhuǎn)化為向量形式。大型模型的性能通常優(yōu)于小型模型。

但這并不意味著越大越好。

別管模型大小。所有模型都在公開數(shù)據(jù)集上訓(xùn)練。它們能區(qū)分“蘋果”水果和“蘋果”品牌。但如果你和朋友用“蘋果”作為暗號,嵌入模型無法知道。

然而,我們創(chuàng)建的幾乎所有應(yīng)用都專注于一個小的細分領(lǐng)域。

對于這些應(yīng)用,大型模型的收益是微不足道的。

這里有一個不同的做法。

為你的領(lǐng)域數(shù)據(jù)創(chuàng)建一個數(shù)據(jù)集,并對小型嵌入模型進行微調(diào)。

小型模型足以捕捉語言細微差別,但可能無法理解在不同語境中有特殊含義的詞。

但仔細想想,你的模型為什么需要理解木星的衛(wèi)星?

小型模型更高效。它們速度快,成本低。

為了彌補模型在領(lǐng)域知識方面的不足,你可以對其進行微調(diào)。

這兩個建議可以優(yōu)化索引部分以實現(xiàn)高效檢索。然而,檢索過程也可以進一步優(yōu)化。

檢索過程可以更高級

最直接的檢索過程是直接查詢。

如果你使用向量數(shù)據(jù)庫,可以對用戶輸入進行語義搜索。否則,你可以使用 LLM 生成 SQL 或 Cipher 查詢。

必要時你還可以調(diào)用 HTTP 端點。

但直接查詢方法很少能產(chǎn)生可靠的上下文。

你可以以更高級的方式查詢數(shù)據(jù)源。例如,你可以嘗試查詢路由技術(shù)來決定從哪個數(shù)據(jù)源獲取數(shù)據(jù)。具有良好推理能力的 LLM 可以用于此目的。你還可以在小型模型上進行指令微調(diào),以節(jié)省成本并降低延遲。

另一種技術(shù)是鏈?zhǔn)秸埱蟆τ诔跏疾樵儯覀兛梢詮臄?shù)據(jù)源獲取信息。然后,根據(jù)獲取的文檔,我們可以獲取后續(xù)文檔。

分塊是 RAG 中最具挑戰(zhàn)性且至關(guān)重要的部分

當(dāng)上下文包含無關(guān)信息時,LLM 容易出現(xiàn)幻覺。

防止 RAG 幻覺的最佳方法是分塊。

現(xiàn)代 LLM 可能支持更長的上下文長度。例如,Gemini 2.5 Pro 支持高達 200 萬個 token,足以容納兩到三本大學(xué)級別的物理教科書。

但對于基礎(chǔ)力學(xué)問題,你很少需要量子物理的上下文信息。

如果你將教科書分解成較小的部分,可能每個部分只討論一個主題,你就能只獲取回答問題所需的相關(guān)信息。

這里的挑戰(zhàn)在于分塊技術(shù)有很多種。每種技術(shù)都有其優(yōu)缺點。適合你領(lǐng)域的技術(shù)可能不適用于其他領(lǐng)域。

遞歸字符分塊可能是最簡單的,也是我的默認選擇。然而,它假設(shè)文本中每個主題的討論長度相等,這很少是事實。盡管如此,這是最好的起點。

圖片圖片

你甚至可以嘗試主題聚類和代理分塊。

嘗試重新排序

最后但同樣重要的是,重新排序。

事實證明,相關(guān)分塊的位置是高質(zhì)量 LLM 響應(yīng)的關(guān)鍵因素。

然而,常規(guī)向量搜索甚至數(shù)據(jù)庫查詢的排序方式并不智能。LLM 可以做到。

因此,我們使用專門的大型語言模型 (LLM) 作為重新排序器,重新排列獲取的上下文并進一步過濾,找出最相關(guān)的分塊。

這種二級重新排序在某些應(yīng)用中有幫助,但在其他應(yīng)用中未必。但你可以使用一些技術(shù)來改進重新排序的結(jié)果。

其中之一是獲取大量初始結(jié)果。寬松定義初始標(biāo)準(zhǔn)會拉取一些無關(guān)上下文,但會增加獲取正確內(nèi)容的概率。

圖片圖片

重新排序器現(xiàn)在可以處理這個大型集合并過濾出更相關(guān)的部分。

最終思考

構(gòu)建 RAG 已成為任何 LLM 應(yīng)用的必備。即使是 200 萬 token 的上下文窗口也無法挑戰(zhàn)它。

我們開發(fā)的原型通常未能部署。部分原因歸于業(yè)務(wù)決策,但也有可以解決的技術(shù)原因。

本文是我在構(gòu)建 RAG 方面的經(jīng)驗總結(jié)。

雖然這不是一個全面的列表,但考慮這五個方面將確保你開發(fā)出更持久的 RAG。

責(zé)任編輯:武曉燕 來源: PyTorch研習(xí)社
相關(guān)推薦

2015-08-26 10:00:31

獨立游戲cp錯誤

2019-11-01 14:19:02

大數(shù)據(jù)機器學(xué)習(xí)工具

2023-07-19 11:19:37

AI項目人工智能

2016-11-02 12:56:58

Linux新手錯誤

2023-01-09 12:06:33

2022-06-28 10:13:09

Pandas錯誤Python

2011-05-31 15:38:37

CSS

2022-05-17 09:32:24

Bash編程Linux

2022-12-26 11:02:06

云計算CIOIT

2011-04-18 12:55:04

JavaScript開發(fā)者

2019-04-24 08:56:34

Java開發(fā)人員常犯錯誤

2016-11-30 14:15:34

網(wǎng)絡(luò)布線錯誤

2015-07-29 10:46:20

Java錯誤

2012-08-31 10:09:04

用戶體驗錯誤初創(chuàng)團隊

2012-09-21 14:02:36

創(chuàng)業(yè)創(chuàng)業(yè)團隊用戶體驗

2018-04-04 09:55:18

語言PHP易犯錯誤

2009-07-10 09:20:11

IT人才經(jīng)驗談

2021-09-02 08:40:10

程序員錯誤

2024-05-27 16:27:22

2011-07-06 08:49:05

程序員
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产一区二区三区在线看 | 亚洲一区在线日韩在线深爱 | 欧美一二三 | 精品成人av | 在线观看视频一区 | 精品欧美 | 毛片日韩| 国产精品久久久久久福利一牛影视 | 超碰伊人久久 | 日本在线视频一区二区 | 亚洲 欧美 综合 | 男人天堂av网站 | 久久免费精品 | 欧美日韩一二三区 | 国产ts人妖系列高潮 | 免费日韩av | 日韩和的一区二在线 | 国产精品日女人 | 欧美精品一二三 | 久久精品亚洲精品国产欧美 | 免费av毛片 | 国产一区二区三区日韩 | 欧美一二三四成人免费视频 | 久久精品一区 | 亚洲精品久久久久久一区二区 | 日韩免费中文字幕 | 视频一二三区 | 亚洲综合在线播放 | 国产精品永久免费视频 | 99精品电影 | www.中文字幕av| 国产日韩一区二区 | 国产精品美女久久久久aⅴ国产馆 | 欧美日韩成人网 | 午夜电影网站 | 一区二区三区日韩精品 | 日韩欧美黄色 | 久久精品国产亚洲一区二区三区 | 精品无码三级在线观看视频 | 天天操夜夜看 | 亚洲网站免费看 |