成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

RARE: 提升LLM推理準(zhǔn)確性和事實(shí)完整性的檢索增強(qiáng)框架思路淺嘗 原創(chuàng)

發(fā)布于 2024-12-11 09:24
瀏覽
0收藏

MCTS & rStar

蒙特卡洛樹搜索(MCTS)

蒙特卡洛樹搜索(MCTS)是一種用于解決復(fù)雜決策問題的算法,常用于游戲等領(lǐng)域。它的基本思想是通過構(gòu)建一棵搜索樹并模擬各種可能的行動(dòng)來估計(jì)每個(gè)行動(dòng)的價(jià)值。MCTS的過程可以分為四個(gè)主要步驟:

  1. 選擇(Selection)

    從根節(jié)點(diǎn)開始,根據(jù)某種策略(如UCT)遍歷子節(jié)點(diǎn),直到找到一個(gè)葉節(jié)點(diǎn)。

    UCT(Upper Confidence Bound applied on Trees)是一種平衡探索和利用的策略。

  1. 擴(kuò)展(Expansion):在葉節(jié)點(diǎn),如果它不是終止?fàn)顟B(tài),則添加一個(gè)或多個(gè)子節(jié)點(diǎn),表示未來可能的行動(dòng)。
  2. 模擬(Evaluation):從新添加的節(jié)點(diǎn)中隨機(jī)選擇一個(gè),進(jìn)行隨機(jī)模擬,直到達(dá)到終止?fàn)顟B(tài),以此估計(jì)該節(jié)點(diǎn)的潛在價(jià)值。
  3. 反向傳播(Backpropagation):將模擬結(jié)果(贏、輸或平局)反向傳播到遍歷過的節(jié)點(diǎn),更新統(tǒng)計(jì)數(shù)據(jù)(如獎(jiǎng)勵(lì)或訪問次數(shù)),以指導(dǎo)未來的決策。

通過這些步驟,MCTS逐步構(gòu)建決策樹,幫助在狀態(tài)空間巨大時(shí)找到最優(yōu)策略。

rStar框架

rStar框架是基于MCTS的擴(kuò)展,通過多種推理動(dòng)作來增強(qiáng)小型語言模型的解決問題的能力。rStar的包含多種推理動(dòng)作:

  • A1:提出一步思考:基于之前的步驟生成下一步推理。
  • A2:提出剩余思考步驟:一次性生成所有剩余的推理步驟。
  • A3:生成下一個(gè)子問題和答案:將主問題分解為一系列子問題,逐一解決。
  • A4:重新回答子問題:重新回答之前生成的子問題,提高準(zhǔn)確性。
  • A5:重述問題/子問題:重述問題以澄清條件,減少誤解。

這些動(dòng)作使rStar能夠動(dòng)態(tài)選擇推理路徑,增強(qiáng)MCTS的探索能力。

RARE方法

RARE: 提升LLM推理準(zhǔn)確性和事實(shí)完整性的檢索增強(qiáng)框架思路淺嘗-AI.x社區(qū)

推理過程:該過程結(jié)合了生成和事實(shí)性評分。(1)檢索增強(qiáng)生成器使用蒙特卡洛樹搜索(MCTS)產(chǎn)生多個(gè)候選推理軌跡;(2)檢索增強(qiáng)事實(shí)性評分器評估每個(gè)推理軌跡的事實(shí)準(zhǔn)確性;(3)選擇事實(shí)性得分最高的軌跡作為最終答案。

通過檢索增強(qiáng)生成器和RAFS兩個(gè)階段,RARE系統(tǒng)地將基于檢索的證據(jù)整合到推理過程中,優(yōu)化了推理的連貫性和事實(shí)準(zhǔn)確性。這種方法使RARE非常適合于常識和推理等知識密集型任務(wù)。

1.檢索增強(qiáng)生成器

這一階段基于MCTS(蒙特卡洛樹搜索)的自生成器,引入了兩個(gè)新的檢索增強(qiáng)動(dòng)作,動(dòng)態(tài)獲取相關(guān)外部信息。這些動(dòng)作通過將上下文化知識整合到中間推理步驟中,提高了候選推理軌跡的相關(guān)性和準(zhǔn)確性,特別是對于復(fù)雜問題。

為了通過外部知識增強(qiáng)推理過程,引入了兩個(gè)新動(dòng)作到檢索增強(qiáng)生成器中:

  • A6:搜索查詢生成與信息檢索

RARE: 提升LLM推理準(zhǔn)確性和事實(shí)完整性的檢索增強(qiáng)框架思路淺嘗-AI.x社區(qū)

該動(dòng)作提示LLM根據(jù)初始問題構(gòu)建搜索查詢并執(zhí)行信息檢索。檢索到的文檔提供了額外的上下文,豐富了推理軌跡,支持生成器形成更全面、更具上下文相關(guān)性的最終答案。

  • A7:子問題檢索與重答

RARE: 提升LLM推理準(zhǔn)確性和事實(shí)完整性的檢索增強(qiáng)框架思路淺嘗-AI.x社區(qū)

該動(dòng)作通過動(dòng)作A3生成的子問題進(jìn)行細(xì)化。對于每個(gè)子問題,生成器檢索特定的相關(guān)信息并使用它來重新回答子問題。這種方法提高了中間推理步驟的準(zhǔn)確性,從而增強(qiáng)了整個(gè)推理軌跡的連貫性和事實(shí)可靠性。

通過這些檢索增強(qiáng)動(dòng)作,生成器可以探索更廣泛的解決方案空間,導(dǎo)致邏輯連貫且富含外部信息的推理路徑。

2. 檢索增強(qiáng)事實(shí)性評分器(RAFS)

這一階段用檢索增強(qiáng)事實(shí)性評分器替換了rStar中的鑒別器,評估每個(gè)候選軌跡的事實(shí)可靠性。評分器驗(yàn)證中間推理步驟與檢索證據(jù)的一致性,分配一個(gè)反映軌跡與外部知識一致程度的事實(shí)性評分。選擇事實(shí)性評分最高的軌跡作為最終答案,優(yōu)先考慮最具事實(shí)支持的推理路徑。這種選擇確保了推理的連貫性和事實(shí)對齊,增強(qiáng)了響應(yīng)的可信度。

RARE引入了檢索增強(qiáng)事實(shí)性評分器(RAFS)。RAFS通過用LLaMA 3.1替換GPT-3.5-turbo,并用包含一般領(lǐng)域知識(Wikipedia)和醫(yī)學(xué)領(lǐng)域資源(PubMed、StatPearls和醫(yī)學(xué)教科書)的語料庫索引檢索系統(tǒng)替換Google Search,從而適應(yīng)特定領(lǐng)域的需求。為了評估生成推理路徑的事實(shí)準(zhǔn)確性,RAFS在四個(gè)系統(tǒng)性步驟中評估每個(gè)候選軌跡,如下圖。

RARE: 提升LLM推理準(zhǔn)確性和事實(shí)完整性的檢索增強(qiáng)框架思路淺嘗-AI.x社區(qū)

  • 分割成語句
    每個(gè)推理軌跡被分割成單獨(dú)的語句。這種分段使得RAFS能夠獨(dú)立驗(yàn)證離散推理步驟的事實(shí)準(zhǔn)確性,增強(qiáng)了整體評估的可靠性。
  • 生成檢索查詢
    對于每個(gè)語句,RAFS使用LLM生成多個(gè)檢索查詢,旨在檢索與上下文相關(guān)的證據(jù)。這些查詢針對可以支持或反駁每個(gè)語句內(nèi)容的信息,確保全面的事實(shí)驗(yàn)證。
  • 檢索信息
    檢索系統(tǒng)收集與每個(gè)生成的查詢相對應(yīng)的文檔或信息。這些證據(jù)為評估每個(gè)推理步驟與外部來源的一致性提供了事實(shí)基礎(chǔ)。
  • 使用檢索信息進(jìn)行評分
    每個(gè)語句與檢索到的證據(jù)進(jìn)行比較,并標(biāo)記為“支持”或“不支持”(如上圖所示,RAFS為每個(gè)語句輸出一個(gè)事實(shí)性得分以及“支持”或“不支持”的標(biāo)簽。),基于與信息的對齊情況。推理路徑的整體事實(shí)性得分計(jì)算為支持語句的比例,指示軌跡的事實(shí)可靠性。這種評分有助于從多個(gè)候選者中選擇最可靠的推理路徑,使RARE能夠優(yōu)先考慮與經(jīng)過驗(yàn)證的外部知識緊密對齊的響應(yīng)。

參考文獻(xiàn)

RARE: Retrieval-Augmented Reasoning Enhancement for Large Language Models,https://arxiv.org/pdf/2412.02830v3


本文轉(zhuǎn)載自公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/L1zyKkJh3zYMEOHcLjLTQw??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 日本精品一区二区三区在线观看视频 | 精品人伦一区二区三区蜜桃网站 | 欧美精品一区二区在线观看 | 欧美日韩国产一区二区 | 国产激情亚洲 | 成人av免费在线观看 | 黄网免费| 韩国电影久久 | 日本精品视频在线观看 | 国产精品久久久 | 成人精品一区二区三区四区 | 黄色在线观看网址 | av色站 | 日本不卡一区二区三区 | 97成人精品 | 天天艹日日干 | 亚洲精品视频观看 | 99精品免费在线观看 | 成人在线电影在线观看 | 风间由美一区二区三区在线观看 | 日韩成人影院在线观看 | 一二三四在线视频观看社区 | 久久精品免费 | 久久久久久久一区 | 一级免费毛片 | 久久精品久久精品 | 香蕉久久久 | 国产aaaaav久久久一区二区 | 91久久久久久久久久久 | 欧洲一区视频 | 久久蜜桃精品 | 性高湖久久久久久久久3小时 | 91久久综合亚洲鲁鲁五月天 | 欧美网址在线观看 | 亚洲精品中文字幕在线 | 欧美一级视频免费看 | 久久机热 | 一区日韩| 天天拍天天操 | 毛片a级 | 精品一区二区在线观看 |