⚡ Labs

Garry Tan开源GBrain:为AI Agent打造的自组网记忆层

Garry Tan开源GBrain:为AI Agent打造的自组网记忆层

你的 AI Agent 足够聪明,但遗憾的是它们有些“健忘”。每次新对话开启,Agent 都会丢失所有历史记忆,不记得你见过谁、读过什么,以及上周二做过什么决定。为了解决这一痛点,Y Combinator 总裁兼 CEO Garry Tan 开源了 GBrain。这是他用来驱动个人 OpenClaw 和 Hermes 智能体部署的生产级项目。作为一个以 Markdown 为中心、基于 Postgres 的知识层,GBrain 能够吸收会议记录、电子邮件、推文和笔记,并在其上自动构建类型化的知识图谱——最关键的是,在提取图谱的过程中无需调用任何大语言模型(LLM)。

目前,运行在 Garry Tan 个人 Agent 后台的生产级大脑已承载了 146,646 页内容、24,585 个人物、5,339 家公司以及 66 个自主定时任务(cron jobs)。在 GBrain 专属的 BrainBench 基准测试(一个包含 240 页富文本的语料库)中,GBrain 达到了 P@5 49.1% 和 R@5 97.9% 的成绩。与禁用图谱层的相同代码库相比,其 P@5 指标大幅提升了 31.4 个百分点。

通过本篇上手教程,你将在本地安装 GBrain,导入一个小型笔记文件夹,运行真实的混合检索,见证知识图谱的自动组网,并最终通过 MCP(Model Context Protocol)将该记忆层连接到 Claude Code。整个过程大约需要 20 分钟。以下所有的终端输出均采集自 GBrain v0.38.2.0 的真实安装环境。该项目基于 MIT 协议开源,托管在 github.com/garrytan/gbrain。

完成本教程后,你将构建并拥有以下组件:
1. 一个本地的 ~/.gbrain/brain.pglite 数据库 —— 采用基于 WASM 编译的嵌入式 Postgres 17 (PGLite),支持 pgvector,无需任何复杂的服务器配置。
2. 一个小型“大脑仓库”,存放有关人物、公司和概念的 Markdown 格式笔记。
3. 一个实用的混合搜索命令行工具(CLI),结合了向量搜索、BM25 关键词检索和互惠排名融合(RRF),并默认搭配 ZeroEntropy 重排器。
4. 一个自动从笔记中提取的类型化知识图谱,包含 works_at、founded、invested_in、attended、advises、mentions 等关系。
5. 一个暴露出 74 个工具的 MCP 服务器,让 Claude Code、Cursor 和 Windsurf 可以直接读写你的 GBrain 数据库。

在开始之前,请确保你的系统满足以下前提条件:使用 macOS 或 Linux(Windows 用户请使用 WSL2);准备一个代码编辑器;安装 Bun ≥ 1.3.10(GBrain 的运行环境);准备一个嵌入模型 API 密钥(可选 ZeroEntropy、OpenAI 或 Voyage),若没有该密钥,你仍可进行关键词搜索,但向量混合查询将无法返回结果;此外,可选备一个 Anthropic API 密钥用于搜索过程中的多查询扩展。

第一步:安装 Bun 和 GBrain。由于 GBrain 是用 TypeScript 编写并在 Bun 上运行的,我们需要先安装 Bun 运行时:
curl -fsSL https://bun.sh/install | bash
exec $SHELL
bun --version
接着,使用全局命令安装 GBrain 客户端:
bun install -g github:garrytan/gbrain
gbrain --version

第二步:初始化你的知识库。运行 gbrain init --pglite 会在本地 ~/.gbrain/ 路径下自动配置一个 PGLite 数据库。由于 PGLite 是完整 Postgres 编译为 WASM 的版本,因此无需运行 Docker 或配置本地数据库服务器,只需约 2 秒钟即可初始化完成。在完成初始化后,你还可以进一步配置嵌入模型提供商(Embedding Provider)来激活向量搜索和混合检索功能,让你的本地 AI 记忆库发挥出完整的双脑连接实力。

【AgentUpdate 深度解析】GBrain 的核心创新在于打破了传统 GraphRAG 极度依赖昂贵 LLM API 的瓶颈。诸如微软的 GraphRAG 等传统方案,在构建实体关系图谱时需要消耗大量的 Token 和计算时间,导致其实时性和经济性较差。而 Garry Tan 设计的 GBrain 采用“零 LLM 提取”的自组网(self-wiring)机制,通过解析 Markdown 结构和确定性规则,以极低的成本实现了秒级的图谱构建。更重要的是,GBrain 紧密拥抱了 MCP 协议,这使其能够立即无缝嵌入到 Cursor、Claude Code 等下一代 AI 编程工具中。这种“轻量化、本地化、实时组网”的设计哲学,代表了 AI Agent 记忆层未来的主流演进方向——从昂贵的“重型云端知识库”向即插即用的“本地轻量认知网”过渡,极大加速了个人 AI 助理的落地进程。

↗ 阅读原文