成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<u id="igyps"></u>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

MemOS：讓大模型告別遺忘、擁有操作系統級記憶管理原創精華

發布于 2025-7-15 08:56

瀏覽

0收藏

論文提出了一個卓越的記憶框架——MemOS，它將記憶功能提升為系統級調用。大語言模型遺忘速度快，重新訓練成本高昂。MemOS將記憶視為操作系統中的文件，讓模型能夠在運行時動態地寫入、移動和淘汰知識，而不僅僅是在訓練期間。它將每個事實或狀態封裝在一個記憶立方體（MemCube）中，標記創建者和時間戳，然后調度器根據使用情況將該立方體在純文本、GPU緩存或微型權重補丁之間移動。在LOCOMO基準測試中，該系統達到73.31分的LLM-Judge平均分，比次佳記憶系統高出約9分，在復雜的多跳和時序問題上保持領先。即使處理約1500個記憶令牌，它也能匹配全上下文的準確性，同時保持與輕量級基線相當的延遲。將熱點立方體切換到KV緩存可在Qwen2.5-72B測試中將首令牌等待時間減少91.4%，且不改變任何輸出文本。總體而言，研究結果表明，將記憶作為操作系統的方法能夠提升推理質量、降低延遲，并同時內置審計和版本控制功能。

MemOS：讓大模型告別遺忘、擁有操作系統級記憶管理-AI.x社區圖片

記憶系統的困境：大多數模型將所有信息壓縮到數十億個凍結權重中，因此更新哪怕一個事實都需要完整的微調。上下文窗口雖然能暫時幫助，但會在下一個提示后消失，而檢索管道會添加額外文本卻不跟蹤版本或所有權。第2頁的圖1顯示MemOS在單跳、多跳、開放域和時序問題上都優于舊有解決方案，這表明單純的參數調整或普通的RAG永遠不夠。

MemOS：讓大模型告別遺忘、擁有操作系統級記憶管理-AI.x社區圖片

記憶立方體的內容：記憶立方體封裝實際記憶加上元數據，如所有者、時間戳、優先級和訪問規則。該封裝適用于三種記憶形式：純文本片段、位于KV緩存中的激活張量，以及低秩參數補丁。由于每個立方體都記錄訪問者和原因，調度器可以將熱點立方體提升到GPU緩存或將冷門立方體存儲到歸檔存儲中，同時不丟失審計軌跡。

MemOS：讓大模型告別遺忘、擁有操作系統級記憶管理-AI.x社區圖片

三層架構的協同工作：接口層將用戶對話轉換為結構化的MemoryAPI調用，將"去年的檢查"之類的問題轉化為時間范圍查詢。操作層運行MemScheduler、MemOperator和MemLifecycle來選擇立方體、融合重疊內容，并將這些立方體標記為激活、合并或歸檔狀態。基礎設施層通過MemGovernance保護立方體，通過MemLoader/MemDumper傳輸它們，并將它們存儲在MemVault中，后者可以是向量存儲、圖數據庫或對象存儲桶。

MemOS：讓大模型告別遺忘、擁有操作系統級記憶管理-AI.x社區圖片

調度器保持記憶新鮮：MemScheduler決定哪個立方體放置在何處。高命中率的純文本轉換為激活張量以便即時重用，穩定的激活模式最終蒸餾為參數補丁以實現零提示開銷。舊立方體則反向滑動，一旦停止獲得命中，昂貴的權重就轉換為便宜的文本。

MemOS：讓大模型告別遺忘、擁有操作系統級記憶管理-AI.x社區圖片

數據驗證效果：在LOCOMO基準測試中，MemOS獲得73.31分的LLM-Judge分數，比次佳系統高出約9分，同時保持相似的延遲預算。在多跳和時序推理方面差距尤其明顯，這些領域在上下文缺失時容易崩潰。

MemOS：讓大模型告別遺忘、擁有操作系統級記憶管理-AI.x社區圖片

KV技巧縮短等待時間：MemScheduler將熱門立方體預先烘焙為KV緩存條目，使模型跳過編碼器工作。在Qwen2.5-72B測試中，首令牌延遲從1.79秒降至0.15秒，減少91%，輸出文本保持逐字節相同。

論文標題：MemOS: A Memory OS for AI System

論文鏈接：???https://arxiv.org/abs/2507.03724??

本文轉載自???????AI帝國???????，作者：無影寺

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關推薦

開源大模型AI代理操作系統：像Windos一樣，操控AI代理

Aceryt ? 3932瀏覽 ? 0回復
生成式AI如何告別版權困擾？基于權重顯著性的機器遺忘算法有奇效

輕薄滴假象 ? 2805瀏覽 ? 0回復
大語言模型高效推理知多少？三萬字長文帶你揭開神秘面紗（數據級、模型級和系統級）

angel ? 1.4w瀏覽 ? 0回復
開源操作系統陸續舉起“禁令”，Debian尚無行動

51CTO技術棧 ? 2707瀏覽 ? 0回復
機器遺忘：為什么教AI學會遺忘至關重要？

51CTO內容精選 ? 2877瀏覽 ? 0回復
谷歌提出視覺記憶方法，讓大模型訓練數據更靈活

Aceryt ? 2595瀏覽 ? 0回復
大模型的記憶困境：平衡持續學習與災難性遺忘

芝士AI吃魚 ? 6643瀏覽 ? 0回復
國內大模型代理商的騷操作

AI探索時代 ? 2587瀏覽 ? 0回復
一文說清楚"知識蒸餾"（讓“小模型”也能擁有“大智慧”）

AI取經路 ? 1.8w瀏覽 ? 0回復
超越 RAG：構建增強而非替代思維的知識管理系統

ermulong ? 2276瀏覽 ? 0回復
告別800秒魔咒！硬件級STA革新視頻DiT注意力，讓HunyuanVideo效率提升3.5倍!

angel ? 2372瀏覽 ? 0回復
Unsloth開源新算法：讓GRPO訓練大模型所需顯存降低90%，告別顯存焦慮！

sbf_2000 ? 3449瀏覽 ? 0回復
從傳統到智能：LLM操作系統的崛起與變革

十一月雨_55 ? 2525瀏覽 ? 0回復
Mem0 讓 AI 擁有超強記憶能力

丟翅膀的魚 ? 4293瀏覽 ? 0回復
PromptPro：AI提示詞管理神器，從此告別雜亂無章！

Halo咯咯 ? 5230瀏覽 ? 0回復
首次全面復盤AI Agents記憶系統：3大類，6種操作！

PaperAgent ? 1976瀏覽 ? 0回復
具備記憶的智能體操作系統，MemoryOS重構AI Agent對話的持久性與個性化

xuxiangda ? 2708瀏覽 ? 0回復
DeepMind | 合成數據+RL，SWiRL讓大模型擁有超強“工具腦”！

arnoldzhw ? 725瀏覽 ? 0回復
中國隊開源首個“類人記憶”操作系統：MemOS，性能超OpenAI方法159%

51CTO技術棧 ? 1362瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

Google發布MoR架構：兩倍推理速度，節省50%內存 2天前發布
Voxtral：Mistral開源的語音識別模型！ 2天前發布

熱門推薦

重磅！英偉達宣布H20芯片即將恢復對華銷售，并計劃推出全新GPU 0回復

我把DeepSeek微調參數扒光了，顯存和性能優化的秘密都在這 0回復

2025年多智能體AI爆發，這五個開源框架太香了！ 0回復

RAG：7個檢索增強生成技術的解析（含實現代碼） 0回復

將智能植根于運動之中——從AI模型到具身智能的下一個躍遷 0回復

上一篇：微軟發布了 Phi-4-mini-flash-reasoning 模型

下一篇： Voxtral：Mistral開源的語音識別模型！

社區精華內容

目錄

主站蜘蛛池模板：国产激情在线 | 亚洲国产精品自拍 | 精品久久一区二区三区 | 欧美一级片| 国产综合久久 | 日韩精品在线一区 | 97色在线视频 | 夜久久| 夜夜精品视频 | 国产二区在线播放 | 天天曰夜夜 | 国产高清精品一区 | 国产精品久久久久久久久久免费看 | 成人做爰69片免费观看 | 成人黄色电影免费 | 国产在线一区二区三区 | 激情小说综合网 | 龙珠z国语版在线观看 | 精品网| 精品久久久久久久久久 | 国产精品久久久 | 久久久久久蜜桃一区二区 | 国产目拍亚洲精品99久久精品 | 精品国产一区二区三区久久久四川 | 国产精品欧美日韩 | av片在线观看网站 | 91婷婷韩国欧美一区二区 | 亚洲综合在线一区 | 午夜激情视频在线 | 欧美在线观看一区 | 电影午夜精品一区二区三区 | 久久综合av | 国产精品一区在线观看你懂的 | 毛片区 | 中文字幕高清av | 日韩中文字幕免费在线 | 国产成人精品免高潮在线观看 | 欧美在线观看免费观看视频 | 午夜精品久久久久久久久久久久 | 精品视频在线观看 | 狠狠狠干|

<kbd id="ppbsm"></kbd>