RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索精華

發(fā)布于 2024-9-4 12:04

瀏覽

0收藏

傳統(tǒng)的注意力機(jī)制由于時(shí)間和空間復(fù)雜度的二次方增長(zhǎng)，以及在生成過(guò)程中鍵值緩存的內(nèi)存消耗不斷增加，限制了模型處理長(zhǎng)文本的能力。相關(guān)的解決方案包括減少計(jì)算復(fù)雜度、改進(jìn)記憶選擇和引入檢索增強(qiáng)語(yǔ)言建模。

檢索增強(qiáng)生成（RAG）和MemLong的記憶檢索流程。 (a) 當(dāng)檢索到的信息長(zhǎng)度超過(guò)模型的處理能力時(shí)，RAG甚至可能會(huì)降低生成性能（黃色）(b) MemLong利用外部檢索器來(lái)獲取歷史信息，然后將這些信息以鍵值對(duì)（K-V）的形式而不是文本形式傳遞給模型。

RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索-AI.x社區(qū) 圖片

提出一種新方案MemLong，結(jié)合一個(gè)非可微分的檢索-記憶模塊和一個(gè)部分可訓(xùn)練的解碼器語(yǔ)言模型，來(lái)增強(qiáng)長(zhǎng)文本上下文的語(yǔ)言建模能力。

MemLong利用外部檢索器來(lái)檢索歷史信息，并通過(guò)細(xì)粒度、可控的檢索注意力機(jī)制，將語(yǔ)義級(jí)別的相關(guān)信息塊整合到模型中。這種方法不僅提高了模型處理長(zhǎng)文本的能力，還保持了信息分布的一致性，避免了訓(xùn)練過(guò)程中的分布偏移問(wèn)題。

MemLong的一個(gè)示例：在底層，模型保持靜態(tài)，對(duì)整個(gè)數(shù)據(jù)塊Ci進(jìn)行因果語(yǔ)言建模，隨后，Ci被緩存為嵌入和鍵值對(duì)（K-V）形式。最后，上層進(jìn)行微調(diào)，以協(xié)調(diào)檢索偏好并整合檢索到的內(nèi)容。

RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索-AI.x社區(qū) 圖片

MemLong的核心原理包括以下幾個(gè)方面：

檢索-記憶模塊：MemLong通過(guò)檢索-記憶模塊來(lái)存儲(chǔ)過(guò)去的上下文和知識(shí)，并利用這些存儲(chǔ)的嵌入向量來(lái)檢索輸入模型的塊級(jí)關(guān)鍵值（K-V）對(duì)。
檢索注意力機(jī)制：MemLong引入了一種細(xì)粒度、可控的檢索注意力機(jī)制，允許模型在局部上下文和通過(guò)檢索獲得的塊級(jí)過(guò)去上下文之間進(jìn)行注意力分配。

檢索因果注意力的說(shuō)明。局部因果注意力應(yīng)用于最近的上下文，而通過(guò)檢索方法獲得的塊級(jí)鍵值對(duì)（K-V）允許雙向注意力，由于它們的歷史性質(zhì)，不會(huì)導(dǎo)致信息泄露。

RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索-AI.x社區(qū) 圖片

動(dòng)態(tài)記憶管理：當(dāng)內(nèi)存溢出時(shí)，MemLong使用計(jì)數(shù)器機(jī)制智能地更新內(nèi)存，保留最有價(jià)值的信息，刪除最不相關(guān)的數(shù)據(jù)，以控制內(nèi)存大小并提高檢索效率。
推理過(guò)程：在處理超出模型最大處理長(zhǎng)度的輸入時(shí)，MemLong將文本存儲(chǔ)為記憶庫(kù)中的上下文信息，并在給定最近生成的文本塊時(shí)，使用檢索器顯式檢索過(guò)去的信息，通過(guò)索引對(duì)齊獲得額外的上下文信息。

通過(guò)這些原理，MemLong在多個(gè)長(zhǎng)文本上下文語(yǔ)言建模基準(zhǔn)測(cè)試中表現(xiàn)出色，證明了其在處理長(zhǎng)文本方面的有效性和優(yōu)越性。MemLong可以將單個(gè)3090 GPU上的上下文長(zhǎng)度從4k擴(kuò)展到80k。

不同上下文窗口擴(kuò)展模型在PG19、Proof-pile、BookCorpus、Wikitext-103上的滑動(dòng)窗口困惑度。所有實(shí)驗(yàn)均在一塊3090 24GB GPU上進(jìn)行。LongLLaMA-3B和MemLong-3B帶有?標(biāo)記的表示在沒(méi)有內(nèi)存的情況下進(jìn)行評(píng)估，而帶有?標(biāo)記的LongLLaMA-3B表示在無(wú)限內(nèi)存的情況下進(jìn)行評(píng)估。還評(píng)估了MemLong在4K/32K內(nèi)存場(chǎng)景下的表現(xiàn)。"- / 6.95"表示模型在單個(gè)GPU上導(dǎo)致內(nèi)存不足（OOM）錯(cuò)誤，而在雙GPU上則產(chǎn)生了相應(yīng)的結(jié)果。

RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索-AI.x社區(qū) 圖片

https://arxiv.org/pdf/2408.16967
https://github.com/Bui1dMySea/MemLong
MemLong: Memory-Augmented Retrieval for Long Text Modeling

本文轉(zhuǎn)載自??PaperAgent??

標(biāo)簽

RAG

MemLong

檢索

贊

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

長(zhǎng)文本殺不死RAG：SQL+向量驅(qū)動(dòng)大模型和大數(shù)據(jù)新范式，MyScale AI數(shù)據(jù)庫(kù)正式開(kāi)源

輕薄滴假象 ? 3715瀏覽 ? 0回復(fù)
騰訊AI新研究打破長(zhǎng)文本生成模型限制，序列并行技術(shù)再突破

AI論文解讀 ? 6414瀏覽 ? 0回復(fù)
通過(guò)檢索增強(qiáng)生成(RAG) 增強(qiáng)LLM的實(shí)戰(zhàn)演練

51CTO內(nèi)容精選 ? 3784瀏覽 ? 0回復(fù)
萬(wàn)文長(zhǎng)文搞定檢索增強(qiáng)生成(RAG)技術(shù)——13篇熱門(mén)RAG文章解讀

angel ? 1.3w瀏覽 ? 0回復(fù)
檢索生成(RAG) vs 長(zhǎng)文本大模型：實(shí)際應(yīng)用中如何選擇？

Baihai_IDP ? 3233瀏覽 ? 0回復(fù)
綜述 | 大模型的可控文本生成

NLP工作站 ? 4149瀏覽 ? 0回復(fù)
MemLong：用于長(zhǎng)文本建模的記憶增強(qiáng)檢索

sbf_2000 ? 2799瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強(qiáng)生成（RAG）技術(shù)

玄姐聊AGI ? 2869瀏覽 ? 0回復(fù)
增強(qiáng)問(wèn)答文本檢索的排序（RAG）模型，你學(xué)會(huì)了嗎？

AI論文解讀 ? 3906瀏覽 ? 0回復(fù)
RAG高級(jí)優(yōu)化：基于問(wèn)題生成的文檔檢索增強(qiáng)

恰似驚鴻 ? 3359瀏覽 ? 0回復(fù)
從檢索增強(qiáng)——RAG看檢索技術(shù)的發(fā)展

AI探索時(shí)代 ? 2412瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強(qiáng)生成（RAG）技術(shù)

Halo咯咯 ? 2349瀏覽 ? 0回復(fù)
再談大模型檢索增強(qiáng)生成——RAG

AI探索時(shí)代 ? 2334瀏覽 ? 0回復(fù)
RAG再進(jìn)化？基于長(zhǎng)期記憶的檢索增強(qiáng)生成新范式-MemoRAG

大模型自然語(yǔ)言處理 ? 2688瀏覽 ? 0回復(fù)
RAG檢索增強(qiáng)生成和大模型微調(diào)的抉擇

AI探索時(shí)代 ? 2636瀏覽 ? 0回復(fù)
九種不同類(lèi)型的檢索增強(qiáng)生成 (RAG)

Halo咯咯 ? 3065瀏覽 ? 0回復(fù)
文本生成無(wú)限長(zhǎng)視頻，無(wú)需任何訓(xùn)練

Aceryt ? 2354瀏覽 ? 0回復(fù)
什么是檢索增強(qiáng)生成 (RAG)？

Halo咯咯 ? 2172瀏覽 ? 0回復(fù)
RAG只能應(yīng)用于文本檢索嗎？關(guān)于大模型應(yīng)用之RAG——檢索增強(qiáng)的思考

AI探索時(shí)代 ? 1520瀏覽 ? 0回復(fù)

PaperAgent

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學(xué)堂

RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索精華

目錄

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學(xué)堂

RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索 精華

目錄

RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索精華