成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<tfoot id="ypvky"><tr id="ypvky"></tr></tfoot>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

采用RAG和知識圖譜克服人工智能幻覺問題原創(chuàng)

51CTO內容精選

發(fā)布于 2024-10-12 07:58

瀏覽

0收藏

將RAG與知識圖譜相結合可以提高生成式人工智能應用程序的準確性，可以使用現(xiàn)有的數(shù)據(jù)庫來完成。

生成式人工智能依賴于數(shù)據(jù)來構建對用戶查詢的響應。而訓練大型語言模型(LLM)需要使用大量數(shù)據(jù)，例如OpenAI公司的GPT-3使用了CommonCrawl數(shù)據(jù)集進行訓練，該數(shù)據(jù)集擁有570GB字節(jié)的數(shù)據(jù)和4000億個令牌。雖然這些數(shù)據(jù)集的規(guī)模龐大，但都是時間快照，無法響應圍繞當前發(fā)生的事件的查詢。人工智能的反應也可能包括“幻覺”——提供看似合理但并不真實的信息。根據(jù)Vectara公司發(fā)布的幻覺排行榜，即使是表現(xiàn)最好的LLM系列 (目前是OpenAI公司開發(fā)的產品)，也存在1.5%至1.9%的幻覺率。

因此，單獨使用LLM面臨兩個問題：答案可能過時或者錯誤。為了克服這些潛在的問題，組織可以使用數(shù)據(jù)流將新信息獲取到他們的數(shù)據(jù)集中，并部署檢索增強生成（RAG）以與生成式人工智能一起使用的方式對業(yè)務數(shù)據(jù)進行編碼。

RAG創(chuàng)建了一組數(shù)據(jù)，可以搜索與用戶查詢相關的語義匹配，然后將這些匹配與LLM共享，以便包含在響應中。隨著時間的推移，向量數(shù)據(jù)集可以添加新的或額外的數(shù)據(jù)，因此可以將相關和及時的數(shù)據(jù)包含在響應中。

RAG面臨的挑戰(zhàn)

盡管RAG使組織能夠將自己的數(shù)據(jù)與生成式人工智能服務結合使用，但它并不完美。在將RAG部署到生產環(huán)境中遇到的一個挑戰(zhàn)是，它無法處理包含相似或相同信息的大量文檔之間的搜索。當這些文件被分塊并轉換成向量嵌入時，每個文件都有可供搜索的數(shù)據(jù)。當這些文件中的每一個都有非常相似的塊時，找到與該請求匹配的正確數(shù)據(jù)會變得更加困難。當查詢的答案存在于多個相互交叉引用的文檔中時，RAG也會遇到困難。而RAG不知道這些文檔之間的關系。

例如，假設組織已經(jīng)開發(fā)了一款聊天機器人服務，它可以調用其產品數(shù)據(jù)來回答客戶的查詢。組織已經(jīng)將小部件目錄轉換為向量數(shù)據(jù)，但是這些小部件都非常相似。當客戶查詢聊天機器人時，即使有RAG，如何確保提供的響應是準確的？如果這些目錄包含指向其他具有額外場景的文檔的鏈接怎么辦？提出不準確的建議或提供不準確的查詢將影響客戶互動。

回答這個問題是考慮采用一種不同的知識管理方法，為RAG所擅長的工作提供補充。微軟研究院在今年早些時候發(fā)布了一份關于將知識圖譜和RAG結合使用的研究報告，其中包括一種名為GraphRAG的技術。

知識圖譜將數(shù)據(jù)點表示為“節(jié)點”和“邊”，而不是將數(shù)據(jù)存儲在傳統(tǒng)搜索的行和列中，也不是作為向量搜索的嵌入。節(jié)點將是一個獨特的事實或特征，并且邊將連接與該事實有相關關系的所有節(jié)點。在產品目錄的示例中，節(jié)點可能是單個產品，而邊將是每個產品所具有的相似特征，例如尺寸或顏色。

向知識圖譜發(fā)送查詢涉及查找與該搜索相關的所有實體，然后創(chuàng)建一個知識子圖，將這些實體匯集在一起。這樣可以檢索出與查詢相關的信息，然后將其返回給LLM并用于構建響應。這意味著可以處理具有多個相似數(shù)據(jù)源的問題。與其將每個源視為不同的源并多次檢索相同的數(shù)據(jù)，不如只檢索一次數(shù)據(jù)。

在RAG中使用知識圖譜

要在RAG應用程序中使用知識圖譜，組織可以使用現(xiàn)有的、經(jīng)過測試且已知事先正確數(shù)據(jù)的知識圖譜，也可以創(chuàng)建自己的知識圖譜。當組織使用自己的數(shù)據(jù)（例如產品目錄）時，需要整理數(shù)據(jù)并檢查其準確性。

組織可以使用自己的生成式人工智能方法來幫助實現(xiàn)這一目標。LLM的構建是為了從內容中提取信息，并在需要時對數(shù)據(jù)進行匯總。對于知識圖譜，可以自動地以正確的格式構建數(shù)據(jù)，并且隨著時間的推移添加更多的數(shù)據(jù)，支持對知識圖譜的任何更新或更改。流行的LangChain服務上有多個工具可以查詢文件，然后提供知識圖譜，包括LLM Graph Transformer和Diffbot，而知識提取工具REBEL是另一種選擇。

對于專用的圖分析項目，可能需要采用一個完整的圖數(shù)據(jù)庫，該數(shù)據(jù)庫可以使用Gremlin和Cipher等圖形語言運行完整的查詢。然而，為了支持作為RAG應用程序一部分的知識圖譜請求，只需要運行同時覆蓋兩三個節(jié)點的小搜索。這意味著請求通常會表示為幾輪簡單的查詢（每步一個）或SQL連接的形式。在更大的數(shù)據(jù)集中進行搜索不太可能返回正確的響應——事實上，這可能會導致查詢失控，這些查詢處理時間過長或實際上無法改善整體響應。

因此，可以使用現(xiàn)有的數(shù)據(jù)庫來存儲知識圖譜數(shù)據(jù)，而不是部署額外的圖數(shù)據(jù)庫。這也簡化了數(shù)據(jù)運營方面的工作，因為可以減少隨時間推移而需要更新新數(shù)據(jù)的數(shù)據(jù)平臺數(shù)量。

將知識圖譜與RAG相結合可以提高生成式人工智能應用程序在響應用戶查詢時的準確性。通過將不同的數(shù)據(jù)管理技術相結合，可以在數(shù)據(jù)性能和請求中的語義理解方面獲得兩全其美的效果。

原文標題：??Overcoming AI hallucinations with RAG and knowledge graphs??，作者：Dom Couldwell

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

大型語言模型

贊

收藏

回復

舉報

回復

相關推薦

基于知識圖譜的少樣本和零樣本學習綜述

mb5f8eba9bdb0af ? 3592瀏覽 ? 0回復
怎么看大模型、RAG、Agent、知識庫、向量數(shù)據(jù)庫、知識圖譜、AGI的區(qū)別和聯(lián)系？

玄姐聊AGI ? 6285瀏覽 ? 0回復
一文搞懂大模型、RAG、函數(shù)調用、Agent、知識庫、向量數(shù)據(jù)庫、知識圖譜、AGI的區(qū)別和聯(lián)系??！

玄姐聊AGI ? 1.5w瀏覽 ? 0回復
利用LlamaIndex和本地PDF文檔，輕松打造知識圖譜GraphRAG

小虎哦哦 ? 4352瀏覽 ? 0回復
采用代碼聊天：理解代碼庫的對話式人工智能

51CTO內容精選 ? 2851瀏覽 ? 0回復
一文搞懂大模型、RAG、函數(shù)調用、Agent、知識庫、向量數(shù)據(jù)庫、知識圖譜、AGI的區(qū)別和聯(lián)系??！

玄姐聊AGI ? 3967瀏覽 ? 0回復
iText2KG：顯著降低LLM構建知識圖譜時的幻覺現(xiàn)象

大語言模型論文跟蹤 ? 3219瀏覽 ? 0回復
AgentRE：用智能體框架提升知識圖譜構建效果，重點是開源！

大語言模型論文跟蹤 ? 4918瀏覽 ? 0回復
基于知識圖譜的LangChain應用實戰(zhàn)

ermulong ? 3184瀏覽 ? 0回復
拋開技術，從問題來串聯(lián)人工智能，機器學習和大模型技術

AI探索時代 ? 2032瀏覽 ? 0回復
什么是知識圖譜和AI多模態(tài)推理

數(shù)字化助推器 ? 2921瀏覽 ? 0回復
RAG與本地知識庫，向量數(shù)據(jù)庫，以及知識圖譜的聯(lián)系與區(qū)別

AI探索時代 ? 5972瀏覽 ? 0回復
GraphRAG+Langchain實現(xiàn)大模型知識圖譜

數(shù)字化助推器 ? 2906瀏覽 ? 0回復
“大模型+知識圖譜”雙輪驅動的見解、技術和評估 - 英偉達的GraphRAG

知識圖譜科技 ? 3190瀏覽 ? 0回復
從數(shù)據(jù)孤島到智能系統(tǒng)：RAG和知識圖譜的協(xié)同作用

51CTO內容精選 ? 2871瀏覽 ? 0回復
MedRAG：利用知識圖譜引導推理提升醫(yī)療Copilot的RAG能力 - 新加坡南洋理工等

知識圖譜科技 ? 4455瀏覽 ? 0回復
基于代理知識蒸餾技術克服文檔提取和RAG策略失敗問題?

51CTO內容精選 ? 1593瀏覽 ? 0回復
使用人工智能幻覺評估圖像真實感?

51CTO內容精選 ? 1710瀏覽 ? 0回復
【人工智能】通過ChatGPT、Claude與通義千問 API 實現(xiàn)智能語料知識圖譜的自動化構建（詳細教程）

唐克 ? 1197瀏覽 ? 0回復

51CTO內容精選

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

建立基于AI的知識體系：面向企業(yè)需求的LlamaIndex與Apache Tika 7分鐘前發(fā)布
一文詳解Character AI：實用指南+ ChatGPT、Gemini對比分析 1天前發(fā)布

熱門推薦

如何在本地運行量化版的DeepSeek-R1-0528？ 0回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數(shù)也沒問題 0回復

AI Agents開源工具棧全解析~ 0回復

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復

上一篇：改進RAG管道檢索文檔質量的五種方法

下一篇：基于PyTorch自動混合精度庫對ResNet50模型進行優(yōu)化訓練

社區(qū)精華內容

目錄

主站蜘蛛池模板：国产一级片在线观看视频 | 日韩在线免费视频 | www.788.com色淫免费 | 成人av一区二区三区 | 一区二区亚洲 | av激情在线 | 国产精品久久午夜夜伦鲁鲁 | 在线观看中文字幕视频 | 黄免费观看视频 | 国产精品欧美一区二区三区 | 成人在线亚洲 | 国产综合久久久久久鬼色 | 亚洲人人 | 日韩视频区 | 日韩精品区 | 欧美午夜精品 | 欧美成人a | 视频在线一区 | 日韩欧美在 | 午夜爽爽爽男女免费观看影院 | 色偷偷噜噜噜亚洲男人 | 欧洲精品久久久久毛片完整版 | 99久久婷婷国产综合精品电影 | 亚洲444eee在线观看 | 精品一区二区在线观看 | 日本一卡精品视频免费 | 国产精品久久久久久久久久久新郎 | 国产精品国产精品国产专区不片 | 在线国产视频 | 亚洲www啪成人一区二区麻豆 | 亚洲日韩中文字幕一区 | 国内自拍偷拍一区 | av在线免费观看网站 | 瑞克和莫蒂第五季在线观看 | 一区二区在线不卡 | 99精品欧美一区二区三区 | 热re99久久精品国99热观看 | 中文字幕精品视频 | 成人国产精品色哟哟 | 中文字幕一区二区三区四区 | 国产午夜精品久久久久 |

<tfoot id="khrjl"></tfoot>