开源大模型GLM-5.2发布：性能媲美闭源，引爆Agent生态

就在AI界因Claude Fable 5遭遇出口限制和变相禁令而震荡不已时，智谱AI（Z.ai）于6月13日（周六）向其编程计划会员低调推出了最新模型GLM-5.2。周末发布模型固然罕见（最著名的先例是Llama 4），但这显然是智谱AI为了抓住当时“Anthropic反对开放科学”的舆论热点而采取的敏捷营销策略。在过去一两年中，中国开源大模型实验室深谙此道，屡屡斩获市场关注。

尽管从命名上看，GLM-5.2似乎只是热门模型GLM-5.1的微调升级，但它带来的体验跨越却是颠覆性的。当前，以Moonshot AI（Kimi背后的公司）和智谱AI为代表的中国头部实验室，已在开源研究界树立了极高的声誉。而#GLM-5.2的推出再次证明，即使是细微的版本号迭代，在经过基准测试优化和微调后，也能突破关键的体验阈值，从而解锁大批全新的应用场景。

该模型在6月16日正式开源并公布了基于MIT协议的模型权重。尽管其技术文档提到了其强大的基准性能、广受欢迎的SLIME强化学习框架以及推荐在“最大思考强度”（Max thinking effort）下运行等细节，但真正检验其成色的是整个开发者生态的真实反馈。在当前基准测试逐渐失真的背景下，社区的实测结果更具说服力。

随后在Arena的Agent评测基准中，GLM-5.2成为了唯一一个能与OpenAI和Anthropic最新旗舰模型并驾齐驱的开源模型。在“最大思考”模式下，它的表现甚至追平了不开启思考模式的Opus 4.8，并在多个评估维度上超越了Gemini。在更具争议性的Design Arena设计基准测试中，GLM-5.2甚至击败了此前备受瞩目的Claude Fable。多位业内顶尖的研究员和意见领袖在亲自试用后，都对这款开源模型给出了极高的评价。

AgentUpdate 深度解析

GLM-5.2 的破局，标志着开源 AI Agent 迎来了真正可用的“分水岭时刻”。过去，开源模型在面对复杂的 Agent 场景（如多步规划、工具调用、长期记忆维护）时，往往因为逻辑链条断裂而逊色于闭源的 GPT-4 或 Claude 系列。而 GLM-5.2 通过深度整合 SLIME 强化学习框架以及精细化的思考时间控制（Max thinking effort），展示出了比肩一线闭源模型的长文本推理与高可靠性。在横向对比上，GLM-5.2 不仅填补了开源生态在“慢思考”（Reasoning）Agent 领域的空白，更是直接对单路调用成本高昂的闭源 API 发起了挑战。随着该模型以 MIT 协议开源，全球开发者将能够以此为基石，构建更具隐私安全、可定制性更强的本地 Agent 协同网络。这无疑将加速 AI Agent 迈向普惠与实用化，深刻改变未来企业级自动化工作流的生态格局。

开源大模型GLM-5.2发布：性能媲美闭源，引爆Agent生态

推荐阅读

亚马逊云科技发力：看小鹏、Kimi如何将AI Agent落地生产

MiniMax发布M3大模型：凭稀疏注意力攻克百万上下文与编程极限

OpenAI 联合推“拯救地球”计划：用 AI 自动修补开源漏洞

相关工具与资源推荐

相关技能市场

Awesome OpenClaw Skills

Skill Atlas