成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<li id="ikqsi"></li>

<center id="ikqsi"></center>

<center id="ikqsi"><acronym id="ikqsi"></acronym></center>

<rt id="ikqsi"></rt>

<button id="ikqsi"></button>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

引入上下文檢索(Contextual Retrieval)：提升AI模型的精準度與效率原創

發布于 2024-11-13 09:47

瀏覽

0收藏

01、概述

在當今的數字時代，人工智能（AI）模型的應用場景越來越廣泛，從客戶支持聊天機器人到法律分析助手，每一種應用都需要準確的背景知識。為了讓AI在特定環境中更有用，開發者通常會利用一種叫做“檢索增強生成（RAG）”的方法。這種方法通過從知識庫中檢索相關信息并將其附加到用戶的提示中，從而顯著提升模型的響應質量。然而，傳統的RAG方案在編碼信息時往往會丟失上下文，導致系統無法有效地檢索到相關信息。

在本文中，我們將介紹一種名為“上下文檢索”的新方法，該方法通過引入兩種子技術——上下文嵌入和上下文BM25，顯著提升了RAG中的檢索步驟。通過這種方法，我們的研究顯示，檢索失敗率減少了49%，而結合重新排序（reranking）時，失敗率甚至減少了67%。這一系列的改進直接提高了后續任務的表現。

02、什么是上下文檢索？

上下文檢索的核心在于在每個文本塊前加上特定的上下文說明，這樣即便是獨立的文本塊也能被準確理解。傳統的RAG方法通常將知識庫中的文檔拆分成較小的文本塊，這樣做雖然提高了檢索效率，但也可能導致每個塊缺乏足夠的上下文信息。例如，在處理財務信息時，如果我們收到這樣的問題：“2023年第二季度ACME公司的收入增長是多少？”相關的文本塊可能只包含“公司的收入比上一季度增長了3%”，但并沒有提到具體是哪個公司，或者增長的時間段。這使得檢索信息的準確性大打折扣。

上下文檢索解決了這個問題，通過將特定上下文附加到每個塊前，確保每個塊在被嵌入和創建BM25索引時都能包含足夠的背景信息。例如，對于我們提到的SEC文件，原始塊“公司的收入比上一季度增長了3%”可以被轉換為“這個塊來自于關于ACME公司2023年第二季度業績的SEC文件；上一季度的收入為3.14億美元。公司的收入比上一季度增長了3%?！?/p>

如何實施上下文檢索？

當然，手動為數以千計的塊注釋并不切實際。為了實施上下文檢索，我們可以借助Claude。我們編寫了一個提示，指導模型為每個塊提供簡潔的塊特定上下文，以提高檢索效果。具體的提示如下：

<document>
{{WHOLE_DOCUMENT}}
</document>
這里是我們希望定位的塊
<chunk>
{{CHUNK_CONTENT}}
</chunk>
請為該塊提供簡潔的上下文，以便改善該塊的檢索效果。只回答上下文，不要其他內容。

通過這個過程，我們可以確保上下文信息被有效地附加到每個文本塊上。

03、傳統RAG方法的局限性

傳統的RAG方法在檢索時可能會破壞上下文信息。由于文檔通常被拆分成較小的塊，如果這些塊單獨存在，可能會導致信息不完整。比如，在處理技術支持數據庫時，如果用戶查詢“錯誤代碼TS-999”，嵌入模型可能會找到關于錯誤代碼的一般信息，但卻可能錯過確切的“TS-999”匹配。這時，BM25這種基于詞匯匹配的老方法則能有效幫助找到確切的匹配。

04、提升檢索精度的方法

結合上下文嵌入和BM25，我們可以通過以下步驟顯著提升檢索的準確性：

將知識庫中的文檔拆分為較小的文本塊，通常不超過幾百個token；
為這些塊創建TF-IDF編碼和語義嵌入；
使用BM25找到基于精確匹配的最佳塊；
利用嵌入查找基于語義相似度的最佳塊；
結合并去重第三和第四步的結果，使用排序融合技術；
將前K個塊添加到提示中以生成響應。

通過這種方式，傳統的RAG系統可以更全面、準確地檢索信息，平衡了精確匹配與廣泛語義理解之間的關系。

引入上下文檢索(Contextual Retrieval)：提升AI模型的精準度與效率-AI.x社區

05、進一步提升性能的重新排序

在傳統RAG中，AI系統在檢索知識庫時，可能會返回大量相關信息塊，有時甚至是數百個。這時，重新排序（reranking）成為一種常用的過濾技術，確保只有最相關的塊被傳遞給模型，從而提升響應質量并減少成本和延遲。

重新排序的步驟

進行初步檢索以獲取最相關的塊（使用了前150個塊）；
將前N個塊及用戶的查詢通過重新排序模型；
使用重新排序模型為每個塊根據其與提示的相關性和重要性打分，然后選擇前K個塊（使用前20個塊）；
將前K個塊傳遞給模型生成最終結果。

通過上下文檢索和重新排序的結合，可以進一步優化檢索的精度。實驗表明，結合上下文嵌入和BM25的重新排序將前20個塊的檢索失敗率減少了67%。

引入上下文檢索(Contextual Retrieval)：提升AI模型的精準度與效率-AI.x社區

成本與延遲考慮

重新排序的一個重要考慮因素是對延遲和成本的影響，尤其是在需要對大量塊進行重新排序時。由于重新排序增加了運行時的額外步驟，雖然它是并行處理的，但不可避免地會增加一些延遲。因此，尋找重新排序更多塊以提高性能與減少延遲和成本之間的平衡是至關重要的。

06、結語

通過我們的實驗，我們發現以下幾條經驗總結：

嵌入加BM25的組合優于單獨使用嵌入；
Voyage和Gemini是測試中效果最好的嵌入模型；
將前20個塊傳遞給模型比僅傳遞前10或前5個更有效；
為塊添加上下文顯著提高檢索準確性；
重新排序效果明顯優于不使用重新排序。

所有這些改進都是相輔相成的，最大化性能提升的方式是將上下文嵌入（來自Voyage或Gemini）、上下文BM25、重新排序步驟以及將20個塊添加到提示中結合在一起。

引入上下文檢索(Contextual Retrieval)：提升AI模型的精準度與效率-AI.x社區

在未來，隨著知識庫的不斷擴展，上下文檢索將成為提升AI模型性能的重要工具，幫助開發者更高效地實現智能化的應用。希望本文能為你在AI開發和應用的道路上提供一些有價值的見解與啟發。

參考：

??https://www.anthropic.com/news/contextual-retrieval??

?

本文轉載自公眾號Halo咯咯作者：基咯咯

原文鏈接：??https://mp.weixin.qq.com/s/2ptg0qtP-JZFwe8RhapbBQ??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

大語言模型

贊

收藏

回復

舉報

回復

相關推薦

「有效上下文」提升20倍！DeepMind發布ReadAgent框架

duhorse ? 3501瀏覽 ? 0回復
LLM超長上下文查詢-性能評估實戰

ermulong ? 3109瀏覽 ? 0回復
提升5.69倍，高效RAG上下文壓縮方法COCOM

Aceryt ? 2585瀏覽 ? 0回復
長上下文 還是 RAG？ Google:我全都要！

探索AGI ? 2527瀏覽 ? 0回復
在長上下文LLM的時代，RAG是否仍然必要？

sbf_2000 ? 2725瀏覽 ? 0回復
Anthropic提出Contextual Retrieval讓RAG再進化，大幅降低檢索失敗率

Syrupup ? 3674瀏覽 ? 0回復
Anthropic研究團隊提出新技術，引入Contextual Retrieval讓RAG再進化，大幅降低檢索失敗率

AI博物院 ? 2709瀏覽 ? 0回復
基于Agent的金融問答系統：RAG的檢索增強之上下文重排和壓縮

一起AI技術 ? 2446瀏覽 ? 0回復
長上下文語言模型評估體系探析

Baihai_IDP ? 2981瀏覽 ? 0回復
LightRAG：提升檢索增強生成的效率與準確性

Halo咯咯 ? 4635瀏覽 ? 0回復
大模型超長窗口上下文與檢索增強生成——RAG

AI探索時代 ? 2847瀏覽 ? 0回復
Claude的MCP（模型上下文協議）簡介

Halo咯咯 ? 5489瀏覽 ? 0回復
谷歌提出Titans：突破算力限制，擴展上下文

Aceryt ? 2085瀏覽 ? 0回復
基于多模態大語言模型的上下文目標檢測

AIRoobt ? 2610瀏覽 ? 0回復
微軟LongRoPE v2：幾乎無損的上下文擴展！

NLP前沿1 ? 2138瀏覽 ? 0回復
Contextual Embedding讓chunk自帶上下文，精準召回，效果立竿見影！

AI博物院 ? 1549瀏覽 ? 0回復
圖解「模型上下文協議（MCP）」：從與傳統 API 的比較入手

Baihai_IDP ? 2346瀏覽 ? 0回復
模型上下文協議（MCP）開發實戰——構建LangChain代理客戶端

51CTO內容精選 ? 4504瀏覽 ? 0回復
RAG系統中的“幕后英雄”：重排器如何提升信息檢索的精準度？

Halo咯咯 ? 1714瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

多模態大語言模型：從視覺故事到技術核心 2天前發布
SmolVLA來襲：用“小模型”解鎖高效機器人控制 2天前發布

熱門推薦

LLaMA 4深度解析：多模態、長文本與高效推理，AI模型的“全能戰士”誕生了！ 0回復

2025年必備的八種AI模型：別再把所有AI都叫LLM了！ 0回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

上一篇： DeepSeek AI發布Janus：一款擁有圖像生成能力的1.3B多模態模型

下一篇：如何讓大型語言模型部署更高效？Run:ai Model Streamer的革命性突破

社區精華內容

目錄

主站蜘蛛池模板：亚洲成人免费视频 | 欧美日韩视频一区二区 | 国产馆 | 99亚洲精品 | 成人午夜视频在线观看 | 黄色在线观看网址 | 天天成人综合网 | 日日夜夜操天天干 | 中文字幕亚洲一区 | 亚洲高清中文字幕 | 中文字幕在线一区二区三区 | 久久久久免费精品国产小说色大师 | 欧美一区二区视频 | 欧美久久综合 | 午夜成人免费视频 | 国产精品久久久爽爽爽麻豆色哟哟 | 亚洲欧美一区二区三区在线 | 最新av在线播放 | 国产极品粉嫩美女呻吟在线看人 | 亚洲免费精品 | 狠狠操狠狠干 | 欧美日韩综合一区 | av免费电影在线 | 欧美高清视频在线观看 | 黄色免费在线观看 | 一区二区三区亚洲 | 国产一区二区三区精品久久久 | 欧美综合一区 | 国产精品久久久久久久久 | 亚洲毛片一区二区 | 日本精品网站 | 久久午夜国产精品www忘忧草 | www.99re| 人人玩人人干 | 国产yw851.c免费观看网站 | 男人的天堂久久 | 欧美xxxx做受欧美 | 国产永久免费 | 日韩精品免费播放 | 毛片区 | 高清人人天天夜夜曰狠狠狠狠 |

<cite id="muess"></cite><button id="muess"></button>

<button id="muess"><source id="muess"></source></button>

<button id="muess"><input id="muess"></input></button>

<rt id="muess"></rt>

<tfoot id="muess"><delect id="muess"></delect></tfoot><rt id="muess"></rt><dl id="muess"><acronym id="muess"></acronym></dl>

<li id="muess"></li><button id="muess"><input id="muess"></input></button>