AI在线 AI在线

告别「失忆」AI!首个大模型记忆操作系统开源框架来了!

该项目来自百家 AI,是北京邮电大学白婷副教授所指导的研究小组, 团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。 大语言模型受限于固定上下文窗口,长期对话中「失忆」、记忆断裂等问题频发,北邮百家 AI 团队重磅推出首个大模型记忆操作系统开源框架 MemoryOS。 巧妙融合计算机操作系统原理与人脑分层记忆机制,构建段页式三级存储架构及四大核心模块(存储、更新、检索、生成),提供全链路用户记忆管理方案,让 AI 智能体拥有持久「记性」与深度「个性」。

该项目来自百家 AI,是北京邮电大学白婷副教授所指导的研究小组, 团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。

大语言模型受限于固定上下文窗口,长期对话中「失忆」、记忆断裂等问题频发,北邮百家 AI 团队重磅推出首个大模型记忆操作系统开源框架 MemoryOS。巧妙融合计算机操作系统原理与人脑分层记忆机制,构建段页式三级存储架构及四大核心模块(存储、更新、检索、生成),提供全链路用户记忆管理方案,让 AI 智能体拥有持久「记性」与深度「个性」。

图片

开源项目地址:https://github.com/BAI-LAB/MemoryOS

大型语言模型(LLMs)固定的上下文窗口如同狭窄的信息通道,导致 AI 在长期对话中频繁「失忆」, 常常导致记忆断裂、事实不一致,个性化交互体验也大打折扣。现有提升 LLM 记忆能力的方法虽各有侧重(如知识提示、RAG 检索优化或模型参数驱动),但均缺乏一个统一的操作系统来对 AI 智能体的记忆进行系统性、综合性的管理。

北邮百家 AI 团队突破性地提出记忆操作系统 MemoryOS,旨在为 AI 智能体实现全面、高效的记忆管理。通过打造强大的「记忆操作系统」,让 AI 智能体长效记忆与个性化交互成为可能。MemoryOS 在主流基准测试中显著提升了 AI 在长对话中的上下文连贯性和个性化记忆保留能力,在 LoCoMo 基准上,模型的 F1 和 BLEU-1 分数平均提升了 49.11% 和 46.18%。

大模型记忆管理

MemoryOS 借鉴了现代操作系统中成熟的内存管理原则,采用短期、中期、长期三级分层记忆存储体系(实时对话存储、主题信息整合、个性化知识沉淀),包含四大核心功能:记忆存储、记忆更新、记忆检索和响应生成,全方位管理 AI 记忆系统。MemoryOS 支持本地部署,为大模型搭载统一的记忆管理插件。

告别「失忆」AI!首个大模型记忆操作系统开源框架来了!

图片

MemoryOS 赋予 AI 三大「记忆超能力」:

✅长效记忆不死板:通过「记忆存储 + 动态更新」双引擎,让多轮对话的上下文关联像人类回忆般自然连贯,千轮交流不「断片」,用户画像随每一次互动持续生长;

✅按需唤醒够精准:四大核心模块(存储、更新、检索、响应)协同运作,如大脑神经突触般快速定位所需信息,既避免「记忆过载」,又杜绝「关键信息丢失」,让应答始终贴合历史语境;

✅个性交互有温度:不再依赖预设模板,而是基于沉淀的用户记忆生成专属回应 —— 从初次对话的兴趣标签,到百次交流后的习惯洞察,AI 真正成为「懂你过去,更知你所需」的智能伙伴。

实验验证

百家 AI 团队在多种基准数据集上进行实验,包括评估多轮对话能力的 GVD 数据集和专为评估长期对话记忆能力设计的 LoCoMo 基准。

1. 显著性能提升:MemoryOS 在所有测试的基准数据集上均展现出卓越性能。特别是在 LoCoMo 基准测试中,搭载 MemoryOS 的 GPT-4o-mini 模型,相较于基线方法,在 F1 和 BLEU-1 上分别取得了平均高达 49.11% 和 46.18% 的显著提升。

图片

2. 高效的平衡: MemoryOS 不仅性能强大,还在计算效率方面表现良好,例如,与 A-Mem * 相比,它需要的 LLM 调用次数显著减少 (4.9 vs 13.0),而与 MemGPT 相比,其消耗的 token 数量也大幅降低 (3,874 vs 16,977),实现了性能与效率的有效平衡。 

图片

记忆管理展示

为了直观展现 MemoryOS 的强大能力,不妨来看一个生动的对比。想象一下,您数周前和 AI 助手表达了健身目标后,某天突然想吃汉堡并咨询 AI 建议时,MemoryOS 不仅能给出低脂美食推荐,还会贴心地结合您之前的健身意愿,提醒您「别忘了还要去健身房哦!」。这种对过去对话细节的精准把握和对用户长期目标的持续关注,使得搭载 MemoryOS 的 AI 系统在交互中展现出远超普通模型的连贯性和个性化深度,从而极大地提升了用户体验。

图片

期望和愿景

百家 AI 团队提出前沿洞察:在 AI 时代,谁掌握用户记忆,谁就能赢得未来竞争的主动权。大模型的进化路径不仅遵循模型规模扩张的「Scaling Law」准则,当搭载 MemoryOS 记忆操作系统,实现记忆的高效管理时,模型的认知能力将迎来质的跃升,或将迎来 Memory Scaling 阶段。MemoryOS 将为大模型带来新的机遇:

✅时空个性化交互整合能力:MemoryOS 打破普通模型短期记忆瓶颈,借助 “记忆唤醒 - 目标匹配 - 个性适配” 机制,在长周期对话中实现个性化与连贯性的深度融合。

✅动态构建个性化用户信息网络:通过每一次对话交互,MemoryOS 持续描摹用户画像,使其成为 AI 时代解码个体个性化需求的原生入口,实现从「单次服务」到「持续理解」的升级。

✅智能迭代赋能多场景需求解码:基于对用户的深度理解,MemoryOS 支持 AI 自主感知需求并持续迭代,在搜索场景中解码消费需求,助力智能营销精准锁定用户意图;同时塑造「智能伙伴」角色,通过长期交互进化为理解用户全维度需求的服务中枢。

这一创新推动 AI 实现从「依赖指令的被动应答」到「理解意图的主动交互」的重要跃升。依托 MemoryOS,AI 能够深度解析用户的潜在需求与行为逻辑,逐步进化为具备持续学习能力的智能伙伴,推动人工智能向更具理解深度的认知智能阶段迈进。

相关资讯

微软等开源AIOpsLab,可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了,一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务,实现故障的自动化检测、定位和解决问题。 还具备高度的可观测性,能够收集和分析关键的遥测数据,确保对系统状态和应用环境的深入洞察。
1/27/2025 9:51:24 AM
AIGC开放社区

DeepSeek开源Janus-Pro-7B:多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

中国人工智能公司 DeepSeek 的 R1“推理”人工智能已经引起了广泛关注,位居应用商店排行榜首位并改变了股市。 随后DeepSeek又宣布开源新一代多模态模型Janus-Pro-7B,该模型在图像生成、视觉问答等任务中全面超越 OpenAI 的 DALL-E 3 和 Stable Diffusion 3,并以“理解-生成双路径”架构和极简部署方案引发AI社区轰动。 性能表现:小模型吊打行业巨头Janus-Pro-7B虽仅有70亿参数(约为GPT-4的1/25),却在关键测试中碾压对手:文生图质量:在GenEval测试中以80%准确率击败DALL-E 3(67%)和Stable Diffusion 3(74%)复杂指令理解:在DPG-Bench测试中达84.19%准确率,能精准生成如“山脚下有蓝色湖泊的雪山”等复杂场景多模态问答:视觉问答准确率超越GPT-4V,MMBench测试得分79.2分接近专业分析模型技术突破:像“双面神”分工协作传统模型让同一套视觉编码器既理解图片又生成图片,如同让厨师同时设计菜单和炒菜。
2/7/2025 11:00:00 AM
AIGC Studio

李飞飞、DeepSeek为何偏爱这个国产模型?

斯坦福李飞飞团队的一篇论文,近来在AI圈子掀起了一场飓风。 他们仅用1000个样本,在16块H100上监督微调26分钟,训出的新模型s1-32B,竟取得了和OpenAI o1、DeepSeek R1等尖端推理模型相当的数学和编码能力! 团队也再次证明了测试时Scaling的威力。
2/8/2025 9:30:00 AM
新智元
  • 1