理解 RAG 第八部分:緩解 RAG 中的幻覺
在可能阻礙語言模型性能的各種問題和挑戰(zhàn)中,幻覺往往位居榜首。當(dāng)語言模型生成虛假、誤導(dǎo)或無意義的信息時(shí),就會(huì)出現(xiàn)幻覺。在檢索增強(qiáng)生成 (RAG) 系統(tǒng)中,語言模型通過檢索和整合外部信息來增強(qiáng)事實(shí)依據(jù),這個(gè)問題得到了緩解,但并未完全消除。
在我們理解 RAG 文章系列的新一期中,我們將探討幻覺問題,與獨(dú)立語言模型相比,它們?cè)?RAG 系統(tǒng)中的表現(xiàn)如何,最重要的是,如何解決這個(gè)具有挑戰(zhàn)性的問題。
為什么 RAG 系統(tǒng)中的幻覺仍然會(huì)發(fā)生
正如本系列的開篇所討論的,RAG 系統(tǒng)相較于傳統(tǒng)語言模型的主要優(yōu)勢之一是能夠通過檢索和整合事實(shí)準(zhǔn)確的信息來減少幻覺,但幻覺仍然可能由于多種原因而產(chǎn)生。事實(shí)上,幻覺仍然是 RAG 系統(tǒng)中最重大的挑戰(zhàn)之一,尤其是那些檢索精度有限或知識(shí)庫質(zhì)量不夠高的方法。
RAG 系統(tǒng)中仍然可能出現(xiàn)幻覺的一個(gè)原因很簡單:如果檢索到的數(shù)據(jù)包含錯(cuò)誤,則生成的響應(yīng)也可能不正確或具有誤導(dǎo)性。在依賴于知識(shí)庫(通常是文檔語料庫,但有時(shí)也是結(jié)構(gòu)化數(shù)據(jù)庫)的 RAG 系統(tǒng)中,數(shù)據(jù)由人為輸入、傳感器收集等,因此條目包含錯(cuò)誤或不準(zhǔn)確的信息并不少見。當(dāng) RAG 的檢索器優(yōu)先考慮或誤解這些“損壞的”數(shù)據(jù)條目或文檔時(shí),出現(xiàn)幻覺的風(fēng)險(xiǎn)就會(huì)增加。如果用戶在 RAG 系統(tǒng)中查詢與該人相關(guān)的人名,文檔或數(shù)據(jù)庫中錯(cuò)誤輸入的人名就足以觸發(fā)“幻覺秀”……或者更糟的是,如果用戶就是那個(gè)人!
當(dāng)檢索到的信息缺乏足夠的細(xì)節(jié)或上下文細(xì)微差別(這些對(duì)于正確解讀至關(guān)重要)時(shí),就會(huì)出現(xiàn)另一個(gè)問題。例如,銀行聊天機(jī)器人 RAG 系統(tǒng)背后的檢索器可能會(huì)檢索有關(guān)抵押貸款條件的信息來響應(yīng)客戶的查詢。但是,如果客戶是殘疾人士或特殊身份,有資格享受額外福利,而檢索器未能檢索到這些特定信息,則生成的響應(yīng)可能會(huì)錯(cuò)失客戶的關(guān)鍵機(jī)會(huì)。這不僅會(huì)導(dǎo)致錯(cuò)誤信息,還可能導(dǎo)致糟糕的用戶體驗(yàn),從而可能導(dǎo)致客戶轉(zhuǎn)向競爭對(duì)手。
無論哪種情況,生成器(RAG 系統(tǒng)內(nèi)的語言模型)都會(huì)嘗試根據(jù)不完整或誤導(dǎo)性的數(shù)據(jù)構(gòu)建響應(yīng),從而導(dǎo)致不可靠或不準(zhǔn)確的輸出。
緩解 RAG 系統(tǒng)中的幻覺
廣義上講,我們可以識(shí)別和分類三種類型的策略或焦點(diǎn)來減輕 RAG 系統(tǒng)中的幻覺:數(shù)據(jù)、上下文以及檢索器和生成器內(nèi)的 AI 和推理過程。
數(shù)據(jù)相關(guān)的緩解策略
減少幻覺的關(guān)鍵在于確保檢索器使用的知識(shí)庫中包含高質(zhì)量且經(jīng)過精心整理的數(shù)據(jù)。如果檢索到的文檔包含錯(cuò)誤、不精確的條目、過時(shí)的信息或偏見,生成器可能會(huì)給出誤導(dǎo)性或不正確的響應(yīng)。為了提高可靠性,可以采取的策略包括嚴(yán)格的數(shù)據(jù)管理、持續(xù)系統(tǒng)地更新知識(shí)庫、自動(dòng)化的事實(shí)核查方法以及過濾掉低質(zhì)量或不相關(guān)的來源。
與環(huán)境相關(guān)的緩解策略
即使數(shù)據(jù)的質(zhì)量和準(zhǔn)確性已經(jīng)得到提升,如果模型未能完全捕捉用戶意圖或檢索所有相關(guān)信息,仍然可能出現(xiàn)幻覺。為了解決這個(gè)問題,專注于上下文改進(jìn)的策略包括優(yōu)化檢索技術(shù)、使用查詢擴(kuò)展進(jìn)行精細(xì)搜索、應(yīng)用重排序模型優(yōu)先選擇與特定場景最相關(guān)的文檔,以及采用先進(jìn)的提示工程技術(shù)。這些策略可能有助于提高檢索到的信息和上下文的相關(guān)性,從而使最終傳遞給生成器的提示能夠提供堅(jiān)實(shí)的上下文基礎(chǔ)。
人工智能與推理過程相關(guān)的緩解策略
最后,即使擁有結(jié)構(gòu)良好的上下文和高質(zhì)量的數(shù)據(jù),語言模型執(zhí)行的推理過程仍然可能導(dǎo)致幻覺。為了應(yīng)對(duì)這一最終挑戰(zhàn),常見的策略包括使用指令遵循數(shù)據(jù)集(旨在幫助語言模型理解和遵循明確指令的訓(xùn)練實(shí)例集合)對(duì)模型進(jìn)行微調(diào)、結(jié)合邏輯推理和常識(shí)推理技術(shù)、利用事實(shí)核查 API 等外部驗(yàn)證工具,以及在 RAG 工作流中集成多步驟推理框架,以產(chǎn)生更連貫、更精確的響應(yīng)。
減輕 | 主要焦點(diǎn) | 關(guān)鍵策略與技巧 | 效益/成果 |
數(shù)據(jù) | 整理并維護(hù)高質(zhì)量數(shù)據(jù) | 嚴(yán)格管理、持續(xù)更新、自動(dòng)核實(shí)事實(shí)、過濾低質(zhì)量來源 | 減少因信息過時(shí)或不準(zhǔn)確而導(dǎo)致的錯(cuò)誤;提高事實(shí)依據(jù) |
語境 | 捕捉用戶意圖并增強(qiáng)檢索細(xì)節(jié) | 優(yōu)化檢索方法、查詢擴(kuò)展、重新排序模型、高級(jí)提示工程 | 提高檢索信息的相關(guān)性和完整性 |
人工智能與推理 | 完善模型決策和推理 | 使用指令數(shù)據(jù)集、邏輯和常識(shí)推理、多步驟框架、外部驗(yàn)證工具進(jìn)行微調(diào) | 減輕固有的模型幻覺,從而產(chǎn)生更連貫的反應(yīng) |
小結(jié)
幻覺是當(dāng)今基于語言模型的人工智能系統(tǒng)面臨的一個(gè)關(guān)鍵問題,RAG 系統(tǒng)盡管能夠部分解決這一問題,卻也不例外。本文探討了 RAG 背景下的幻覺問題,重點(diǎn)闡述了在生成響應(yīng)之前檢索外部信息的系統(tǒng)中仍可能出現(xiàn)幻覺的原因,并提出了可在 RAG 系統(tǒng)、數(shù)據(jù)庫和知識(shí)庫中實(shí)施的幾種實(shí)用策略,以緩解幻覺問題。