⚡ News

腾讯开源腾讯云 Agent Memory:四层记忆架构,长程 Agent 效率提升 50%

腾讯开源腾讯云 Agent Memory:四层记忆架构,长程 Agent 效率提升 50%

腾讯正式开源了 TencentDB Agent Memory,这是一套专门为 AI Agent 设计的存储系统。该项目采用 MIT 开源协议,核心目标是解决长程 Agent(Long-horizon agents)开发中的顽疾:上下文膨胀(Context Bloat)和记忆召回失败。

该系统将符号化短期记忆与分层长期记忆相结合,目前已作为插件集成到 OpenClaw 框架中,并通过 Gateway 适配器连接到 Hermes Agent。在底层架构上,它默认使用本地 SQLite 及 sqlite-vec 扩展,无需外部 API 即可运行,极大降低了隐私风险和延迟。

针对传统记忆架构中数据碎片化、召回盲目搜索的问题,腾讯提出了一套四层“语义金字塔”结构。这四个层级分别是:L0 会话(原始对话记录)、L1 原子事实(细粒度事实提取)、L2 场景块(特定场景逻辑)和 L3 用户画像(Persona)。系统在检索时会优先查询 L3 层以获取用户偏好,仅在需要细节时才向下钻取。其中,画像和场景等高层信息以 Markdown 文件形式存储,而事实和日志则存储在数据库中以便全文检索。

在短期记忆处理上,TencentDB Agent Memory 引入了基于 Mermaid 语法的符号化方案。长程任务产生的冗长工具日志和代码执行结果会被卸载到外部文件中(refs/*.md),而 Agent 的上下文窗口中仅保留轻量级的任务画布(Task Canvas)。Agent 通过推理符号图进行决策,当需要原始文本时,再通过 node_id 精确回溯。这种“确定性下钻”机制显著优化了 Token 利用率。

根据腾讯公布的评测数据,该系统在 WideSearch 任务上将 Agent 的成功率从 33% 提升至 50%,同时 Token 使用量从 221.31M 骤降至 85.64M,降幅达 61.38%。在模拟复杂编程任务的 SWE-bench 上,成功率从 58.4% 提升至 64.2%,Token 消耗也降低了 33.09%。

↗ 阅读原文