ChatGPT的記憶機制被公開了

2025-05-16 10:17:54

最近OpenAI推出了一項名為聊天歷史記錄的額外記憶功能，允許ChatGPT引用歷史對話以進行個性化交互。

ChatGPT新版記憶功能居然被民間大佬逆向工程了！

能引用歷史記錄，甚至還能悄悄藏個人資料？

最近OpenAI推出了一項名為聊天歷史記錄的額外記憶功能，允許ChatGPT引用歷史對話以進行個性化交互。

相較于原有的保存記憶功能，新功能更私人、更懂你。

相關功能默認關閉，需要用戶自行在“設置->個性化->參考聊天記錄”中啟用。

非全面開放、無法通過API供開發(fā)者使用，于是各路技術大佬開始著手破解起新記憶功能的具體機制和技術實現(xiàn)路徑，甚至披露了連官方都沒有透露的聊天記錄系統(tǒng)的三大子系統(tǒng)細節(jié)。

那記憶功能到底是怎么工作的呢？結(jié)合多位大佬的分析，我們總結(jié)如下：

記憶系統(tǒng)是如何工作的

據(jù)官網(wǎng)介紹，目前已知存在兩種記憶功能：參考保存記憶和參考聊天記錄。

但在具體實驗中發(fā)現(xiàn)，聊天記錄系統(tǒng)實際上可以細分為當前對話歷史記錄、對話歷史記錄和用戶洞察三個子系統(tǒng)。

接下來我們依次進行單獨闡述。

首先是大家最熟悉的保存記憶系統(tǒng)，簡單、用戶可控，用以保存用戶自定義信息，例如你的姓名、喜歡的顏色或飲食偏好。

這些信息會被引入系統(tǒng)提示，用戶需要使用類似“Remember that I …”的提示明確要求ChatGPT記住。此外還可以通過用戶界面查看和刪除信息。

具體的實現(xiàn)過程如下：

由于ChatGPT通過bio工具保存記憶，可以使用以下代碼創(chuàng)建工具的合理近似值：
將其定義為LLM調(diào)用，以接受用戶消息和現(xiàn)有事實列表，然后返回新事實列表或拒絕，此外需要進行測試和迭代以確保行為正確。
以上便完成了用戶信息到系統(tǒng)提示的注入。另外如果想要實現(xiàn)與ChatGPT的功能對等，還可以再構(gòu)建一個簡單的UI來檢查和刪除這些信息。

而新功能聊天記錄系統(tǒng)實際要復雜得多，且很有可能在助手響應速度的提升中發(fā)揮重要作用。

這是用戶在其他對話中發(fā)送的近期消息的簡單記錄，小到只包含最近一天的信息。

同時，由于該系統(tǒng)和對話RAG系統(tǒng)都可能將用戶的直接引用內(nèi)容添加到模型上下文中，從而難以界定信息來源。

它可以直接通過過濾ChatMessage按時間排序，并設置有消息限制的用戶消息表來輕松實現(xiàn)。

該系統(tǒng)包含先前對話的相關上下文，直接援引其他對話中的信息，提供更簡短但不具體的舊對話背景。

但ChatGPT無法正確維護消息順序，也無法在明確的時間范圍內(nèi)回憶，例如：“引用在過去一小時內(nèi)發(fā)送的所有消息”，因此它應當是通過對話摘要和消息內(nèi)容進行消息檢索。

于是據(jù)推測，在該系統(tǒng)中很有可能存在一個用戶查詢列表，用來存儲整個對話摘要索引的匯總。

它的技術實現(xiàn)過程為：

首先配置兩個向量空間，其索引分別為message-content和conversation-summary。
將發(fā)送的信息插入到message-content向量空間，當對話處于非活動狀態(tài)一段時間后，再將用戶信息添加到conversation-summary空間，另外配置一個由摘要索引并包含摘要的第三個向量空間。