成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型檢索增強(qiáng)生成之向量數(shù)據(jù)庫(kù)的問(wèn)題

人工智能
現(xiàn)如今向量數(shù)據(jù)庫(kù)主要應(yīng)用于與人工智能特別是大模型相關(guān)的技術(shù)領(lǐng)域,比如RAG技術(shù),就是嚴(yán)重依賴于向量數(shù)據(jù)庫(kù)。當(dāng)然,向量數(shù)據(jù)庫(kù)的應(yīng)用場(chǎng)景遠(yuǎn)不止RAG一家,比如還有推薦系統(tǒng),圖像識(shí)別等多種不同的領(lǐng)域。??????????????????????????

作為技術(shù)人員我想大家或多或少應(yīng)該都接觸過(guò)數(shù)據(jù)庫(kù)技術(shù),數(shù)據(jù)庫(kù)技術(shù)的歷史可以說(shuō)是由來(lái)已久了;但數(shù)據(jù)庫(kù)的發(fā)展也是一路曲折,特別是隨著互聯(lián)網(wǎng)體量的快速增加,對(duì)數(shù)據(jù)庫(kù)的要求也變得越來(lái)越多。

而且為了適應(yīng)各種不同的業(yè)務(wù)場(chǎng)景,數(shù)據(jù)庫(kù)系統(tǒng)也是緊跟潮流發(fā)展出多種類型的數(shù)據(jù)庫(kù);比如說(shuō)傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),緩存數(shù)據(jù)庫(kù),以及大數(shù)據(jù)處理的數(shù)據(jù)庫(kù);直到今天的向量數(shù)據(jù)庫(kù)。

關(guān)系型和緩存數(shù)據(jù)庫(kù)就不用說(shuō)了,今天我們就來(lái)聊聊向量數(shù)據(jù)庫(kù)系統(tǒng)。

向量數(shù)據(jù)庫(kù)向量數(shù)據(jù)庫(kù)

向量數(shù)據(jù)庫(kù),顧名思義就是以向量結(jié)構(gòu)為主體的數(shù)據(jù)庫(kù);同樣具備傳統(tǒng)數(shù)據(jù)庫(kù)的CRUD等功能。

但是,因?yàn)槭且韵蛄繛橹鳎皇且詡鹘y(tǒng)的字符匹配為主;因此,向量數(shù)據(jù)庫(kù)在使用的過(guò)程中就面臨著很多之前沒遇到的問(wèn)題。

現(xiàn)如今向量數(shù)據(jù)庫(kù)主要應(yīng)用于與人工智能特別是大模型相關(guān)的技術(shù)領(lǐng)域,比如RAG技術(shù),就是嚴(yán)重依賴于向量數(shù)據(jù)庫(kù)。當(dāng)然,向量數(shù)據(jù)庫(kù)的應(yīng)用場(chǎng)景遠(yuǎn)不止RAG一家,比如還有推薦系統(tǒng),圖像識(shí)別等多種不同的領(lǐng)域。

向量數(shù)據(jù)庫(kù)相對(duì)于傳統(tǒng)數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)在于,其可以通過(guò)對(duì)不同模態(tài)數(shù)據(jù)的向量化,計(jì)算數(shù)據(jù)之間的向量關(guān)系,以此來(lái)描述不同數(shù)據(jù)之間的“語(yǔ)義”相關(guān)性。

也就是說(shuō),向量數(shù)據(jù)庫(kù)主要描述的不是字符之間的確定關(guān)系,而是從語(yǔ)義的角度來(lái)描述數(shù)據(jù)關(guān)系。而計(jì)算這種關(guān)系的算法叫做相似度計(jì)算,具體的有歐式距離,余弦相似度等算法。

圖片圖片

因此,向量數(shù)據(jù)庫(kù)有兩個(gè)重點(diǎn),一個(gè)是數(shù)據(jù)向量化;二是向量相似度計(jì)算。在大模型技術(shù)領(lǐng)域,數(shù)據(jù)向量化也叫做嵌入,需要使用專門的嵌入模型對(duì)數(shù)據(jù)進(jìn)行向量化處理。

對(duì)向量數(shù)據(jù)庫(kù)來(lái)說(shuō),數(shù)據(jù)向量化解決的是數(shù)據(jù)從那來(lái)的問(wèn)題,而向量相似度計(jì)算解決的是相似度搜索問(wèn)題,也就是數(shù)據(jù)該怎么使用的問(wèn)題。

數(shù)據(jù)向量化,也就是嵌入模型需要加載數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行切分,分詞等操作;最后再進(jìn)行向量化處理,也就是把不同模態(tài)的數(shù)據(jù)統(tǒng)一轉(zhuǎn)化成向量的格式。

至于相似度搜索問(wèn)題,就是把你需要搜索的數(shù)據(jù)同樣轉(zhuǎn)化為向量格式,然后向量數(shù)據(jù)庫(kù)引擎,把你的搜索向量與數(shù)據(jù)庫(kù)中存在的向量進(jìn)行匹配,這個(gè)就是相似度計(jì)算,也就做度量計(jì)算;比如歐式距離,余弦相似度,內(nèi)積等。最后計(jì)算得到的結(jié)果就是搜索結(jié)果。

向量數(shù)據(jù)庫(kù)的搜索問(wèn)題與傳統(tǒng)數(shù)據(jù)庫(kù)的查詢沒有本質(zhì)上的不同,區(qū)別就是傳統(tǒng)數(shù)據(jù)庫(kù)使用的是字符匹配的方式;而向量數(shù)據(jù)庫(kù)使用的是相似度計(jì)算的方式。

但這里有一個(gè)問(wèn)題就是,由于向量相似度需要大量的運(yùn)算才能獲得結(jié)果;因此,在面對(duì)大量向量數(shù)據(jù)時(shí),搜索性能與搜索結(jié)果的準(zhǔn)確性就需要做一個(gè)權(quán)衡。

還有一點(diǎn)就是,不同于傳統(tǒng)的字符匹配的方式,一就是一,二就是二;向量相似度搜索是基于相似度計(jì)算得到的相似值;而不是絕對(duì)值,因此就存在搜索結(jié)果的不確定性。

比如說(shuō),在具體的實(shí)踐過(guò)程中,在一個(gè)向量化的四大名著之西游記的向量數(shù)據(jù)庫(kù)中;輸入林黛玉進(jìn)行檢索竟然可以檢索到相似數(shù)據(jù);而這在具體的應(yīng)用場(chǎng)景中是不可接受的。

圖片圖片

之所以能在西游記中搜索到與林黛玉有關(guān)的內(nèi)容,原因就在于這個(gè)相似度計(jì)算;因?yàn)榱主煊袷桥模饔斡浿幸彩桥模豢赡芪饔斡浐图t樓夢(mèng)中部分關(guān)于女性的描述,在向量層面是相似的,也就是相似度計(jì)算的值比較接近,最終才導(dǎo)致這種結(jié)果。

這就是向量相似度搜索的不確定性,但又很難完全避免;畢竟前面也說(shuō)了,效率與準(zhǔn)確率總要犧牲一個(gè)。

所以,基于向量數(shù)據(jù)庫(kù)的檢索結(jié)果,還需要在結(jié)果出來(lái)之后做一層到多層到數(shù)據(jù)篩選,才有可能完全獲取想要的結(jié)果。

責(zé)任編輯:武曉燕 來(lái)源: AI探索時(shí)代
相關(guān)推薦

2024-01-17 09:00:00

大型語(yǔ)言模型機(jī)器學(xué)習(xí)向量搜索引擎

2025-02-11 08:00:00

大語(yǔ)言模型檢索增強(qiáng)生成CAG

2025-05-28 01:25:00

RAG人工智能語(yǔ)言模型

2024-05-20 08:31:33

檢索增強(qiáng)生成LLM大型語(yǔ)言模型

2025-01-23 16:23:30

2023-10-14 17:46:17

RAG提示工程GPT-3

2024-05-28 09:24:32

2024-10-31 14:46:31

2024-11-19 13:05:40

2023-10-27 10:23:35

大語(yǔ)言模型人工智能

2023-11-08 16:18:32

人工智能矢量數(shù)據(jù)庫(kù)

2024-09-05 08:24:09

2025-04-01 09:25:09

2023-10-06 13:52:40

數(shù)據(jù)庫(kù)模型

2023-11-21 08:00:20

AI模型

2025-04-29 08:20:51

2024-01-08 15:35:34

2024-06-18 15:36:50

2024-02-18 09:00:00

RAG工具LlamaIndexChatGPT

2025-05-22 06:23:48

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 91福利网 | 成人影院午夜 | 精品日韩一区二区 | 国产一二三区精品视频 | 国产一级特黄aaa大片评分 | 欧美视频在线观看 | 热久久999 | 在线 丝袜 欧美 日韩 制服 | 久久高清 | 国产精品免费一区二区三区 | 日韩精品一区二区三区视频播放 | 中文字幕亚洲一区 | 操操操日日日 | 久久久精品影院 | 亚洲一区 中文字幕 | 97碰碰碰| 欧美极品在线视频 | 美女视频黄色片 | 日韩一二区 | 欧美一区二区在线 | 国内精品伊人久久久久网站 | 四虎影院在线免费观看 | 国产成人免费观看 | 国产在线观看一区二区三区 | 国产视频一视频二 | 视频一区 亚洲 | 亚洲精品在线免费 | 久久久久电影 | 欧美日韩一区二区三区在线观看 | 亚洲欧美一区二区三区在线 | 中文字幕在线观看第一页 | 综合网视频 | 亚洲欧美视频一区 | 看a网站 | 国产精品美女久久久久aⅴ国产馆 | 日本在线视 | 黄色一级毛片 | 黄色片大全在线观看 | 偷拍第一页 | 国产成人精品av | 天天射中文 |