成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

RAG系列:一文讓你由淺到深搞懂RAG實(shí)現(xiàn)

人工智能
RAG(檢索增強(qiáng)生成)是一種結(jié)合檢索與生成的技術(shù),通過實(shí)時(shí)檢索外部知識(shí)庫(kù)中的信息,動(dòng)態(tài)增強(qiáng)大語(yǔ)言模型(LLM)的生成能力,是用于解決幻覺問題、知識(shí)時(shí)效問題、超長(zhǎng)文本問題等各種大模型本身制約或不足的必要技術(shù)。

1. RAG簡(jiǎn)介

RAG(檢索增強(qiáng)生成)是一種結(jié)合檢索與生成的技術(shù),通過實(shí)時(shí)檢索外部知識(shí)庫(kù)中的信息,動(dòng)態(tài)增強(qiáng)大語(yǔ)言模型(LLM)的生成能力,是用于解決幻覺問題、知識(shí)時(shí)效問題、超長(zhǎng)文本問題等各種大模型本身制約或不足的必要技術(shù)。

圖片

RAG核心流程包括:

  • 問題理解階段對(duì)用戶問題進(jìn)行改寫、擴(kuò)寫和重構(gòu),讓用戶問題更利于檢索;
  • 檢索召回階段從外部知識(shí)庫(kù)(如企業(yè)文檔、行業(yè)數(shù)據(jù)庫(kù))中篩選與用戶問題相關(guān)的片段,并將檢索結(jié)果與原始問題整合為增強(qiáng)提示詞,輸入給LLM;
  • 答案生成階段:LLM基于增強(qiáng)后的提示詞,生成精準(zhǔn)、可靠的答案。

RAG具有以下優(yōu)點(diǎn):

  • 實(shí)時(shí)性:動(dòng)態(tài)接入最新數(shù)據(jù)(如新聞、更新文檔),突破模型訓(xùn)練數(shù)據(jù)的時(shí)間限制;
  • 專業(yè)性:通過連接領(lǐng)域知識(shí)庫(kù)(如醫(yī)療指南、法律條文)提升回答的準(zhǔn)確性;
  • 成本效益:無(wú)需全量微調(diào)模型,僅維護(hù)輕量級(jí)知識(shí)庫(kù)即可擴(kuò)展能力;
  • 可信度增強(qiáng):生成答案基于可追溯的檢索證據(jù),減少“一本正經(jīng)胡說八道”的幻覺風(fēng)險(xiǎn)。

但是,不少人提出RAG的“原罪”--一周出demo,半年用不好。這里主要存在如下5方面的問題:

問題1:內(nèi)容缺失

當(dāng)用戶問題不清晰或者知識(shí)庫(kù)未及時(shí)更新導(dǎo)致檢索內(nèi)容缺失,LLM可能會(huì)無(wú)中生有地回答問題。

例如:用戶詢問“2025年杭州新能源車補(bǔ)貼政策”,但文檔庫(kù)僅更新至2024年數(shù)據(jù),此時(shí)LLM卻生成“2025年補(bǔ)貼政策將延續(xù)現(xiàn)有標(biāo)準(zhǔn)”的錯(cuò)誤答案。

問題2:未正確排序

問題的答案在知識(shí)庫(kù)中,但由于包含答案的文檔沒有被正確的排序,導(dǎo)致沒有在被召回的前K個(gè)文檔中(K在實(shí)際操作中不可能被設(shè)置的無(wú)限大,會(huì)基于大模型能力、成本等因素折中選擇一個(gè)值)。

例如:用戶查詢“阿司匹林與布洛芬的副作用差異”,知識(shí)庫(kù)中某篇研究論文第8頁(yè)明確對(duì)比了兩者差異,但該文檔在檢索排序中位列第12名(K=10),導(dǎo)致未被召回。

問題3:未在上下文中

整合策略局限性。從知識(shí)庫(kù)中檢索到了包含答案的文檔,但在生成答案的過程中,這些文檔并未被納入上下文。當(dāng)返回許多文檔時(shí),會(huì)進(jìn)行文檔整合以獲取答案,此時(shí)會(huì)發(fā)生這種情況。

例如:用戶提問“青藏高原年平均降水量”,檢索到一篇地理研究報(bào)告包含該數(shù)據(jù)(第3章第2節(jié)),但系統(tǒng)整合時(shí)僅保留第1章氣候特征概述,導(dǎo)致答案缺失。

問題4:未提取答案

包含答案的文檔存在于上下文中,但LLM未能提取出正確的答案。通常,這是因?yàn)樯舷挛闹写嬖谔嘣肼暬蛎苄畔ⅰ:?jiǎn)而言之,檢索是正確的,但是LLM根據(jù)檢索的文檔回答問題出錯(cuò)。睜眼說瞎話的概率明顯大于用戶可以接受的概率(用戶一般只能接受0.1%的錯(cuò)誤概率)。

例如:上下文明確標(biāo)注“2024年全球光伏裝機(jī)容量為550GW”,但LLM受其他段落“2030年預(yù)測(cè)達(dá)1200GW”干擾,錯(cuò)誤回答“當(dāng)前裝機(jī)容量接近1000GW”。

問題5:答案不完整

包含答案的文檔存在于上下文中,但是LLM回答時(shí)也可能遺漏一些關(guān)鍵信息。

例如:上下文包含“火山噴發(fā)原因包括板塊運(yùn)動(dòng)、巖漿房壓力、地下水汽化”,LLM僅回答“板塊運(yùn)動(dòng)導(dǎo)致噴發(fā)”。

2. RAG分類

RAG的特點(diǎn)是依賴外部數(shù)據(jù)來(lái)準(zhǔn)確解決用戶提出的問題,因此根據(jù)與外部數(shù)據(jù)的交互復(fù)雜度和認(rèn)知處理深度,當(dāng)前主流研究將RAG系統(tǒng)劃分為以下四個(gè)層次:

層次1:顯性事實(shí)查詢

此類用戶問題是外部數(shù)據(jù)中直接存在的明確事實(shí),無(wú)需任何額外推理。

例如:根據(jù)給定的一系列關(guān)于奧運(yùn)會(huì)的文檔,回答:2024年夏季奧運(yùn)會(huì)將在哪里舉行?

層次2:隱性事實(shí)查詢

此類用戶問題是外部數(shù)據(jù)中的隱性事實(shí),這些事實(shí)不是顯而易見的或者分布在多個(gè)文檔片段中,可能需要一定程度的常識(shí)推理或基本的邏輯推理。

例如:根據(jù)給定的一系列醫(yī)療記錄,回答:最常提及的前3個(gè)癥狀是什么?

層次3:可解釋原理查詢

對(duì)此類用戶問題的回答,不僅要求掌握事實(shí)內(nèi)容,還需要理解和應(yīng)用與數(shù)據(jù)上下文密不可分的領(lǐng)域特定原理的能力。這些原理通常在外部資源中明確提供,在一般大型語(yǔ)言模型的預(yù)訓(xùn)練階段通常不存在或很少遇到。

例如:根據(jù)給定的胸痛管理指南,回答:應(yīng)該如何診斷和治療有特定癥狀描述的胸痛患者?

層次4:隱式原理查詢

對(duì)此類用戶問題的回答涉及更具挑戰(zhàn)性的領(lǐng)域,其中原理沒有明確記錄,但必須從外部數(shù)據(jù)中觀察到的模式和結(jié)果中推斷出來(lái)。

例如:根據(jù)給定的一系列財(cái)務(wù)報(bào)告,回答:經(jīng)濟(jì)形勢(shì)將如何影響公司未來(lái)的發(fā)展?

image.png

論文:https://arxiv.org/html/2409.14924?_immersive_translate_auto_translate=1

3. 產(chǎn)品架構(gòu)

圖片

RAG產(chǎn)品架構(gòu)包含四層:

  • 模型層:在模型層屏蔽掉了模型的差異,不僅可以支持自有私域的LLM,也可以支持線上商用大模型,第三方的模型。此外,embedding的優(yōu)化,有效的解決語(yǔ)言表達(dá)差異導(dǎo)致的檢索問題,同時(shí)提高了模型的效果;
  • 離線理解層:該層主要圍繞知識(shí)庫(kù)和搜索增強(qiáng)兩個(gè)模塊設(shè)計(jì)的。關(guān)于智能知識(shí)庫(kù)主要負(fù)責(zé)將非結(jié)構(gòu)化的文本進(jìn)行處理,從而轉(zhuǎn)化為檢索知識(shí)庫(kù),主要包括文本解析,表格讀取,OCR識(shí)別等。搜索增強(qiáng)通過引入問句改寫、重排等模塊,保證檢索的精準(zhǔn)度;
  • 在線問答層:為了滿足產(chǎn)品設(shè)計(jì)和交互體驗(yàn)需要,這里支持多文檔、多輪次、多模態(tài)等;
  • 應(yīng)用層:針對(duì)不同行業(yè)的特點(diǎn),預(yù)制多種場(chǎng)景類角色,降低產(chǎn)品使用門檻。

4. 技術(shù)架構(gòu)

圖片

RAG技術(shù)框架分為三個(gè)主要組成部分:?jiǎn)栴}理解模塊、檢索召回模塊和答案生成模塊。

  • 問題理解模塊:該模塊旨在對(duì)用戶的問題進(jìn)行理解或者將用戶的問題生成結(jié)構(gòu)化的查詢,既可以查詢結(jié)構(gòu)化的數(shù)據(jù)庫(kù)也可以查詢非結(jié)構(gòu)化的數(shù)據(jù),進(jìn)而提高召回率。該模塊主要包括意圖識(shí)別、問題改寫和問題擴(kuò)寫;
  • 檢索召回模塊:該模塊旨在從給定的知識(shí)庫(kù)中檢索與用戶問題最相關(guān)的信息。該模塊主要包括文檔加載、文檔轉(zhuǎn)換、文檔嵌入&檢索和文檔后處理;
  • 答案生成模塊:該模塊旨在將檢索結(jié)果與原始問題整合后的增強(qiáng)提示詞輸入給LLM,讓LLM生成精準(zhǔn)、可靠的答案。該模塊主要包括Prompt拼接和LLM生成策略。

4.1. 問題理解模塊

在RAG應(yīng)用中,可能會(huì)遇到從知識(shí)庫(kù)中檢索到與用戶問題不相關(guān)的內(nèi)容,這是由于:

  • 用戶問題過于簡(jiǎn)單,沒有更多的上下文信息;
  • 用戶問題可能混雜無(wú)關(guān)內(nèi)容;
  • 用戶問題有模糊詞匯、歧義詞匯和縮寫詞;
  • 用戶問題沒有生成結(jié)構(gòu)化查詢。

為了解決上述問題,在RAG應(yīng)用中可能需要引入問題理解模塊。

4.1.1. 意圖識(shí)別

對(duì)用戶問題進(jìn)行意圖識(shí)別,解析出用戶問題的隱含需求,使RAG系統(tǒng)能自適應(yīng)地組合檢索策略,平衡效率與精度。

核心方法如下:

  • 數(shù)據(jù)源選擇優(yōu)化

     通過實(shí)體識(shí)別提取用戶問題中的關(guān)鍵要素(如產(chǎn)品型號(hào)、時(shí)間范圍),動(dòng)態(tài)匹配對(duì)應(yīng)領(lǐng)域的知識(shí)庫(kù);

     若問題包含視覺關(guān)鍵詞(如“CT影像分析”),自動(dòng)切換到醫(yī)學(xué)圖像庫(kù),文本類問題則調(diào)用文檔數(shù)據(jù)庫(kù)。

  • 查詢策略決策

     當(dāng)用戶需求為宏觀概覽(如“概括新能源政策要點(diǎn)”),觸發(fā)摘要引擎對(duì)長(zhǎng)文檔進(jìn)行壓縮提取;

     當(dāng)用戶需要詳細(xì)的技術(shù)細(xì)節(jié)(如“如何修復(fù)手機(jī)充電接口接觸不良”),啟用向量索引進(jìn)行深度語(yǔ)義匹配。

  • 多路由協(xié)同執(zhí)行

     對(duì)開放式問題(如“人工智能發(fā)展趨勢(shì)分析”),同時(shí)調(diào)用行業(yè)報(bào)告庫(kù)、學(xué)術(shù)論文庫(kù)和新聞數(shù)據(jù)庫(kù),合并檢索結(jié)果;

     在金融風(fēng)控場(chǎng)景中,既檢索合同條款庫(kù)又調(diào)用法律條文庫(kù),綜合生成合規(guī)建議。

4.1.2. 問題改寫

對(duì)用戶問題進(jìn)行語(yǔ)義等價(jià)的重構(gòu)與優(yōu)化,保持核心意圖不變,提升問題表達(dá)清晰度與檢索精準(zhǔn)性。

核心方法如下:

  • 同義詞替換:將口語(yǔ)化詞匯轉(zhuǎn)換為專業(yè)術(shù)語(yǔ)(如“蘋果手機(jī)”→“iPhone 15 Pro Max”);
  • 消除歧義:通過上下文補(bǔ)全明確模糊表述(如“蘋果”補(bǔ)充為“蘋果公司產(chǎn)品”);
  • 結(jié)構(gòu)優(yōu)化:拆分復(fù)合問題(如“Python安裝和數(shù)據(jù)分析”拆分為Python安裝和Python數(shù)據(jù)分析兩個(gè)子查詢)。

4.1.3. 問題擴(kuò)寫

在原問題基礎(chǔ)上增加關(guān)聯(lián)信息或限定條件以擴(kuò)展覆蓋范圍,提高檢索召回率與長(zhǎng)尾信息覆蓋能力。

核心方法如下:

  • 關(guān)鍵詞拓展:添加相關(guān)術(shù)語(yǔ)(如“學(xué)習(xí)Python”擴(kuò)展為“Python編程教程+實(shí)戰(zhàn)項(xiàng)目資源”);
  • 條件補(bǔ)充:增加時(shí)間/空間約束(如“新能源車?yán)m(xù)航”補(bǔ)充為“2024年特斯拉Model Y冬季續(xù)航數(shù)據(jù)”);
  • 領(lǐng)域知識(shí)注入:融入專業(yè)參數(shù)(如“拍照好”擴(kuò)展為“索尼IMX989傳感器+光學(xué)防抖”)。

4.2. 檢索召回模塊

本文只針對(duì)文本數(shù)據(jù)進(jìn)行講解,多模態(tài)數(shù)據(jù)(圖像、音頻和視頻)的處理比較復(fù)雜,這里先不展開講。

4.2.1. 文檔檢索

在實(shí)際應(yīng)用中,一般需要獲取到與用戶問題最相關(guān)的那些文檔數(shù)據(jù),而不是將整個(gè)文檔全部檢索出來(lái)。因此檢索技術(shù)的選擇和實(shí)現(xiàn)就至關(guān)重要了,這個(gè)直接影響到RAG系統(tǒng)的應(yīng)用效果。

不同的應(yīng)用場(chǎng)景對(duì)應(yīng)不同的檢索技術(shù),主要有傳統(tǒng)RAG、GraphRAG以及DeepSearcher,傳統(tǒng)RAG和GraphRAG是成熟的范式,分別適合文檔檢索和關(guān)系查詢,而DeepSearcher代表未來(lái)方向,通過深度學(xué)習(xí)優(yōu)化搜索過程,適合復(fù)雜、個(gè)性化的需求。

圖片

傳統(tǒng)RAG

傳統(tǒng)RAG適用于單點(diǎn)的事實(shí)查詢,采用的是扁平化的向量空間形式,讓信息之間的關(guān)系更加直觀,然后通過比較文本向量之間的相似度來(lái)找到最相關(guān)的信息。

圖片

這里的技術(shù)要求是如何將一個(gè)大型的文檔數(shù)據(jù)進(jìn)行分割,以便可以更精確的檢索到與用戶問題相關(guān)的文檔片段,然后放到LLM的上下文中。常見的分割方法有:

  • 遞歸分割 (Recursive):基于用戶定義的字符列表遞歸分割文本,旨在保持相關(guān)文檔片段相鄰。推薦作為初始分割方法;
  • HTML 分割:基于HTML特定字符分割文本,并添加關(guān)于文本來(lái)源的元數(shù)據(jù)(基于HTML結(jié)構(gòu));
  • Markdown 分割:基于Markdown特定字符分割文本,并添加關(guān)于文本來(lái)源的元數(shù)據(jù)(基于Markdown結(jié)構(gòu));
  • 代碼分割:基于編程語(yǔ)言(如Python、JS等)特定字符分割文本,支持15種不同語(yǔ)言;
  • 詞元分割 (Token):基于token分割文本,存在幾種不同的token測(cè)量方式;
  • 字符分割 (Character):基于用戶定義的單個(gè)字符分割文本,是一種較為簡(jiǎn)單的方法;
  • 語(yǔ)義塊分割 (Semantic Chunker):首先按句子分割文本,然后如果相鄰句子在語(yǔ)義上足夠相似,則將它們合并。

文檔數(shù)據(jù)分割好了一個(gè)個(gè)小的片段之后,在使用文本嵌入模型(如 text-embedding-ada-002)將文本塊轉(zhuǎn)換成固定維度的向量,然后存儲(chǔ)到向量數(shù)據(jù)庫(kù)(如 Milvus)中。

文檔數(shù)據(jù)示例:

哪吒是一個(gè)天生反骨的少年英雄,具有雷電屬性,屬于闡教。
他的父親是李靖(陳塘關(guān)總兵),母親是殷夫人。
他的師父是太乙真人,是闡教弟子。
敖丙是東海三太子,具有冰雪屬性,屬于龍族。
...
GraphRAG

GraphRAG適用于需跨實(shí)體關(guān)聯(lián)的復(fù)雜問題,引入知識(shí)圖譜技術(shù)構(gòu)建實(shí)體關(guān)系網(wǎng)絡(luò),通過圖數(shù)據(jù)庫(kù)(如 NebulaGraph)實(shí)現(xiàn)多跳推理與結(jié)構(gòu)化知識(shí)關(guān)聯(lián)。

該技術(shù)結(jié)合了圖結(jié)構(gòu)的數(shù)據(jù)遍歷和路徑查詢技術(shù),能夠更精準(zhǔn)地定位相關(guān)信息,然后結(jié)合向量相似度檢索補(bǔ)充局部語(yǔ)義信息,形成混合結(jié)果集給到LLM。

圖片

這里的技術(shù)要求是要在傳統(tǒng)RAG的基礎(chǔ)之上構(gòu)建知識(shí)圖譜:

  • 實(shí)體與關(guān)系抽取:調(diào)用LLM識(shí)別文本塊中的實(shí)體(如人名、機(jī)構(gòu)名)和關(guān)系(如因果關(guān)系、隸屬關(guān)系),輸出為(實(shí)體、關(guān)系、實(shí)體)三元組,然后對(duì)提取的實(shí)體生成抽象描述性摘要,解決實(shí)體引用不一致問題(如別名歸一化);
  • 圖結(jié)構(gòu)生成:構(gòu)建同質(zhì)無(wú)向加權(quán)圖(節(jié)點(diǎn):表示實(shí)體,權(quán)重反映實(shí)體出現(xiàn)頻率與重要性,邊:表示關(guān)系,權(quán)重通過關(guān)系實(shí)例的標(biāo)準(zhǔn)化計(jì)數(shù)計(jì)算),然后通過圖數(shù)據(jù)庫(kù)(如 NebulaGraph)存儲(chǔ)圖譜數(shù)據(jù),支持分布式擴(kuò)展。
節(jié)點(diǎn)(VERTEX)數(shù)據(jù)示例:
INSERT VERTEX role (name, meteorological, faction, role_desc, voice_actor) VALUES 
  "哪吒": ("哪吒", "雷電", "闡教", "天生反骨的少年英雄", "呂艷婷"),
  "敖丙": ("敖丙", "冰雪", "龍族", "東海三太子,哪吒的摯友", "瀚墨"),
  "太乙真人": ("太乙真人", "云霧", "闡教", "哪吒的師父,闡教弟子", "張珈銘"),
  "殷夫人": ("殷夫人", "細(xì)雨", "人類", "哪吒的母親,溫柔賢惠", "綠綺"),
  "李靖": ("李靖", "木", "人類", "哪吒的父親,陳塘關(guān)總兵", "陳浩"),
  "申公豹": ("申公豹", "風(fēng)暴", "截教", "截教弟子,野心勃勃", "楊衛(wèi)"),
  "敖光": ("敖光", "海浪", "龍族", "東海龍王,敖丙之父", "雨辰"),
  "敖閏": ("敖閏", "空間系", "龍族", "東海龍王之女", "周泳汐"),
  "敖順": ("敖順", "毒", "龍族", "東海龍王之子", "韓雨澤"),
  "敖欽": ("敖欽", "火", "龍族", "東海龍王之子", "南嶼"),
  "石磯娘娘": ("石磯娘娘", "沙塵", "截教", "截教弟子", "小薇"),
  "結(jié)界獸": ("結(jié)界獸", "霧靄", "中立", "守護(hù)結(jié)界的神獸", "");
邊(EDGE)數(shù)據(jù)示例:
// 家庭關(guān)系
INSERT EDGE father_of VALUES "李靖" -> "哪吒": (NOW());
INSERT EDGE mother_of VALUES "殷夫人" -> "哪吒": (NOW());
INSERT EDGE father_of VALUES "敖光" -> "敖丙": (NOW());
INSERT EDGE father_of VALUES "敖光" -> "敖閏": (NOW());
INSERT EDGE father_of VALUES "敖光" -> "敖順": (NOW());
INSERT EDGE father_of VALUES "敖光" -> "敖欽": (NOW());
// 師徒關(guān)系
INSERT EDGE teacher_of VALUES "太乙真人" -> "哪吒": (NOW());
// 朋友關(guān)系
INSERT EDGE friend_of VALUES "哪吒" -> "敖丙": (NOW());
INSERT EDGE friend_of VALUES "敖丙" -> "哪吒": (NOW());
// 敵對(duì)關(guān)系
INSERT EDGE enemy_of VALUES "申公豹" -> "太乙真人": (NOW());
INSERT EDGE enemy_of VALUES "申公豹" -> "哪吒": (NOW());
// 兄妹關(guān)系
INSERT EDGE brother_sister_of VALUES "敖丙" -> "敖閏": (NOW());
INSERT EDGE brother_sister_of VALUES "敖丙" -> "敖順": (NOW());
INSERT EDGE brother_sister_of VALUES "敖丙" -> "敖欽": (NOW());
DeepSearcher

DeepSearcher適用于需動(dòng)態(tài)調(diào)整的多維度需求,通過樹形層次結(jié)構(gòu)來(lái)組織數(shù)據(jù),并逐步反饋迭代,使得查找特定信息時(shí)能夠像瀏覽文件夾一樣方便快捷。

該技術(shù)采用多層次并行搜索加上智能過濾的方式從大量數(shù)據(jù)中快速準(zhǔn)確地獲取所需信息,然后結(jié)合多模態(tài)檢索(向量+關(guān)鍵詞+圖),最終得到最精準(zhǔn)的信息。

圖片

分層數(shù)據(jù)示例:

# 角色基本信息
## 哪吒- 名稱: 哪吒- 屬性: 雷電- 陣營(yíng): 闡教- 描述: 天生反骨的少年英雄,擁有超凡的力量和勇氣- 配音: 呂艷婷- 性格特點(diǎn): 叛逆不羈,重情重義,敢于挑戰(zhàn)命運(yùn)
### 哪吒的關(guān)系網(wǎng)絡(luò)- 父親: 李靖(陳塘關(guān)總兵,嚴(yán)厲正直)- 母親: 殷夫人(溫柔慈愛,理解包容)- 師父: 太乙真人(循循善誘,關(guān)愛弟子)- 摯友: 敖丙(東海三太子,冰雪之力)- 敵人: 申公豹(截教弟子,處處作梗)
### 哪吒的劇情發(fā)展- 初遇敖丙: 在東海邊緣的相遇,兩個(gè)不同世界的少年- 修行歷程: 在太乙真人門下學(xué)習(xí)法術(shù),逐漸掌握雷電之力- 友情萌芽: 與敖丙從互不理解到成為摯友- 身份困擾: 面對(duì)闡教弟子和凡人雙重身份的矛盾- 成長(zhǎng)蛻變: 在各種挑戰(zhàn)中突破自我,尋找真我
### 哪吒的能力特點(diǎn)- 主要法術(shù): 雷電操控,混天綾,乾坤圈- 戰(zhàn)斗風(fēng)格: 靈活多變,攻擊凌厲- 特殊天賦: 天生具有超凡力量- 成長(zhǎng)軌跡: 從初學(xué)者到掌握強(qiáng)大法力
## 敖丙- 名稱: 敖丙- 屬性: 冰雪- 陣營(yíng): 龍族- 描述: 東海三太子,溫潤(rùn)如玉的貴族少年- 配音: 瀚墨- 性格特點(diǎn): 溫和有禮,重情重義,內(nèi)心堅(jiān)韌
### 敖丙的關(guān)系網(wǎng)絡(luò)- 父親: 敖光(東海龍王,威嚴(yán)莊重)- 兄弟姐妹:   - 敖閏(龍女,擅長(zhǎng)空間法術(shù))  - 敖順(二皇子,精通毒術(shù))  - 敖欽(大皇子,掌控火焰)- 摯友: 哪吒(闡教弟子,雷電之力)- 屬下: 結(jié)界獸(守護(hù)東海結(jié)界)
### 敖丙的劇情發(fā)展- 身份困擾: 作為龍族繼承人的責(zé)任與壓力- 友情抉擇: 在族群立場(chǎng)與個(gè)人情誼間的掙扎- 能力覺醒: 冰雪之力的不斷提升與掌控- 性格成長(zhǎng): 從謹(jǐn)慎拘謹(jǐn)?shù)介_朗自信- 守護(hù)之道: 保護(hù)東海與親友的決心
### 敖丙的能力特點(diǎn)- 主要法術(shù): 冰雪操控,水系法術(shù)- 戰(zhàn)斗風(fēng)格: 優(yōu)雅從容,防守反擊- 特殊天賦: 天生親和水元素- 成長(zhǎng)軌跡: 從單純的王子到獨(dú)當(dāng)一面
## 太乙真人- 名稱: 太乙真人- 屬性: 云霧- 陣營(yíng): 闡教- 描述: 闡教重要弟子,哪吒的師父- 配音: 張珈銘- 性格特點(diǎn): 智慧通達(dá),慈悲為懷
### 太乙真人的關(guān)系網(wǎng)絡(luò)- 弟子: 哪吒(得意門生)- 同門: 其他闡教仙人- 對(duì)手: 申公豹(截教弟子)
### 太乙真人的劇情參與- 收徒教導(dǎo): 發(fā)現(xiàn)哪吒天賦,悉心培養(yǎng)- 化解危機(jī): 多次調(diào)解哪吒與各方矛盾- 守護(hù)正道: 對(duì)抗截教勢(shì)力的滲透
# 陣營(yíng)勢(shì)力分析
## 闡教- 代表人物: 太乙真人、哪吒- 特點(diǎn): 崇尚正統(tǒng),重視秩序- 立場(chǎng): 維護(hù)天地秩序,抵制混亂- 修行特色: 注重心性修養(yǎng),講究循序漸進(jìn)
### 闡教的理念- 修行觀: 重視內(nèi)在修養(yǎng)- 處世態(tài)度: 主動(dòng)干預(yù),匡扶正義- 對(duì)待人間: 既重視規(guī)則,也關(guān)注個(gè)體
## 龍族- 代表人物: 敖光、敖丙- 特點(diǎn): 高貴優(yōu)雅,重視傳統(tǒng)- 立場(chǎng): 守護(hù)東海,維護(hù)龍族利益- 統(tǒng)治方式: 等級(jí)分明,講究禮制
### 龍族的傳統(tǒng)- 治理理念: 重視血脈傳承- 對(duì)外態(tài)度: 謹(jǐn)慎自守,避免沖突- 內(nèi)部規(guī)則: 等級(jí)森嚴(yán),重視禮法
## 截教- 代表人物: 申公豹- 特點(diǎn): 包容駁雜,手段靈活- 立場(chǎng): 追求變革,不拘一格- 行事風(fēng)格: 靈活多變,善用權(quán)謀
### 截教的特點(diǎn)- 修行方式: 講究實(shí)用- 處世態(tài)度: 積極進(jìn)取,不拘形式- 發(fā)展策略: 廣收門徒,擴(kuò)張勢(shì)力
# 重要事件與劇情發(fā)展
## 東海危機(jī)### 事件起因- 結(jié)界異常- 勢(shì)力沖突- 個(gè)人恩怨
### 事件發(fā)展- 哪吒與敖丙的相遇- 各方勢(shì)力的介入- 矛盾的激化與升級(jí)
### 事件影響- 個(gè)人成長(zhǎng)- 勢(shì)力變化- 關(guān)系轉(zhuǎn)變
## 人物關(guān)系演變### 友情的考驗(yàn)- 立場(chǎng)差異- 信任建立- 共同成長(zhǎng)
### 師徒情誼- 教導(dǎo)方式- 互相理解- 成長(zhǎng)蛻變

4.2.2. 檢索后處理

經(jīng)過前面的檢索過程可能會(huì)得到很多相關(guān)文檔,就需要進(jìn)行篩選和排序。常用的篩選和排序策略包括:

  • 基于相似度分?jǐn)?shù)進(jìn)行過濾和排序;
  • 基于關(guān)鍵詞進(jìn)行過濾,比如限定包含或者不包含某些關(guān)鍵詞;
  • 讓 LLM 基于返回的相關(guān)文檔及其相關(guān)性得分來(lái)重新排序;
  • 基于時(shí)間進(jìn)行過濾和排序,比如只篩選最新的相關(guān)文檔;
  • 基于時(shí)間對(duì)相似度進(jìn)行加權(quán),然后進(jìn)行排序和篩選。

4.3. 答案生成模塊

檢索召回模塊基于用戶問題檢索出相關(guān)的文檔片段,答案生成模塊則是讓LLM利用檢索出的相關(guān)信息來(lái)生成對(duì)用戶問題的回復(fù)。該模塊依賴于LLM的能力以及prompt的拼接和調(diào)試。

4.3.1. Prompt拼接

用于將提示的不同部分組合在一起。您可以使用字符串提示或聊天提示來(lái)執(zhí)行此操作。

  • 字符串提示:使用模板將所有查詢到的文檔片段和原始問題拼接在一起作為提示(如 langchain 的promptTemplate);
  • 聊天上下文提示:將歷史對(duì)話記錄、用戶偏好等上下文信息、所有查詢到的文檔片段和原始問題拼接在一起作為提示(如 langchain 的 ChatPromptTemplate)。

4.3.2. LLM生成策略

  • 策略1:是依次結(jié)合每個(gè)檢索出的相關(guān)文檔片段,每次不斷修正生成的回復(fù)。這樣的話,有多少個(gè)獨(dú)立的相關(guān)文檔片段,就會(huì)產(chǎn)生多少次的LLM調(diào)用;
  • 策略2: 是在每次LLM調(diào)用時(shí),盡可能多地在Prompt中填充文檔片段。如果一個(gè)Prompt中填充不下,則采用類似的操作構(gòu)建多個(gè)Prompt,多個(gè)Prompt的調(diào)用可以采用和前一種相同的回復(fù)修正策略。
責(zé)任編輯:龐桂玉 來(lái)源: 燃哥講AI
相關(guān)推薦

2025-06-04 03:21:00

RAGRetrievalGeneratio

2022-01-16 18:55:33

MySQL事務(wù)數(shù)據(jù)庫(kù)

2024-06-24 14:32:33

2025-05-20 11:55:22

人工智能Vision RAGLLM

2025-04-10 00:12:00

2024-09-26 07:27:27

2024-06-24 08:05:00

人工智能AI

2021-10-20 08:49:30

Vuexvue.js狀態(tài)管理模式

2024-07-08 12:44:11

2022-09-29 10:26:59

iOSScaffoldflutter

2025-05-30 01:00:00

RAG大模型流程

2022-03-24 08:51:48

Redis互聯(lián)網(wǎng)NoSQL

2024-04-12 12:19:08

語(yǔ)言模型AI

2024-09-19 09:12:50

RAG系統(tǒng)技術(shù)

2009-06-30 10:40:25

JSP自定義標(biāo)簽

2009-07-02 15:31:49

JSP標(biāo)簽

2025-05-21 09:32:28

2021-03-22 10:05:59

netstat命令Linux

2023-09-08 08:20:46

ThreadLoca多線程工具

2023-09-15 12:00:01

API應(yīng)用程序接口
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 欧美在线a | 亚洲中字在线 | 日韩成人免费 | 欧美日韩在线一区二区 | 在线观看成人精品 | www.黄色片视频 | 国产激情一区二区三区 | 欧美在线观看一区 | 四虎影院在线免费观看 | 亚洲国产精品福利 | 免费在线观看毛片 | 污免费网站 | 国产精品欧美一区二区 | 日本小电影网站 | 91精品国产一区 | 91人人看 | 精品日韩电影 | 日韩av成人在线观看 | 日韩第1页 | 精品一区国产 | 国产一区二区三区高清 | 国产精品久久久久久久久久尿 | 国产免费一区二区三区 | 久久免费精品 | 免费黄色片在线观看 | 亚洲成人免费视频 | 免费同性女女aaa免费网站 | 国内精品视频在线观看 | 久久久国产一区二区 | 农村妇女毛片精品久久久 | 999久久久久久久久6666 | 91 久久| 精品一区二区三区四区五区 | 97人人超碰| 久久久久国产一区二区三区 | 欧美福利一区 | 国产精品高清在线 | av国产精品| 日韩久草| 国产高清精品一区二区三区 | 91精品国产一区二区三区 |