SOURCE // NEWS

GPT-5.6首批实测曝光!迎战Mythos 5,前端生成与Agent编码成焦点

GPT-5.6首批实测曝光!迎战Mythos 5,前端生成与Agent编码成焦点

就在 Anthropic 扔下大杀器发布 Claude Fable 5Mythos 5 的同时,OpenAI 的新一代旗舰模型 GPT-5.6 也随之曝光。上周起,OpenAI 内部开始测试代号为 “kepler” 和 “kindle” 的两个新检查点(checkpoint),其中 kindle-alpha 已被曝光选为发布候选版本(RC)。这让海外开发者和技术泄露圈彻底沸腾,各种跑分、实测和代号细节被接连挖出。

所谓检查点,就是模型在训练过程中某个时间点存下的参数快照。OpenAI 通常会横向对比多个版本,并挑选一个性能最稳健的版本作为候选版。根据目前的实测反馈,#GPT-5.6 最显著的升级在于前端UI生成能力。测试者 Pankaj Kumar 指出,kindle-alpha 在生成前端界面时,无需复杂的 Prompt 或额外技巧,就能直接产出极其精美的界面交互,视觉理解和图像引用任务的表现也同样亮眼。

然而,不同测试者之间的体验存在分歧。开发者 Leo 在高强度测试模式(xhigh)下对比了 kepler 和 kindle 两个版本,发现 kindle 相比 kepler 甚至在某些表现上有所退步。这表明 OpenAI 可能会继续打磨,不排除弃用该候选版本的可能。最新动向显示,kindle 已被移出测试竞技场,取而代之的是一个名为 Levi 的新模型,其展示的极简高端前端风格同样令人瞩目。

那么,GPT-5.6 究竟能否击败 Mythos 5?有爆料称,GPT-5.6 在多个智能体编码基准测试(agentic coding benchmarks)中已经超越了 Mythos。在这个炎热的 6 月,AI 行业正上演着“御三家”的生死时速:Fable 5、Gemini 3.5 Pro 和 GPT-5.6 齐聚一堂。尽管性能对决尚未尘埃落定,但价格战已悄然打响——Mythos 5 统一定价为每百万输入 Token 10 美元、输出 50 美元,如果 GPT-5.6 能在性能持平的情况下提供更具竞争力的价格,或许将赢得更多开发者的青睐。

AgentUpdate 深度解析

此次 GPT-5.6 与 Mythos 5 的巅峰对决,核心战场已从单纯的“自然语言对话”演变为“主动执行能力”,特别是 agentic coding(智能体编码)与前端 UI 的自主生成。这标志着 AI Agent 正在跨越从“思考”到“构建与落地”的鸿沟。以往的 Agent 往往受限于静态工具调用,而具备极强 UI 生成和高阶推理能力的新一代模型,使 Agent 能够根据任务实时、自主地生成交互式前端(Dynamic UI),实现人机协同的闭环。在技术路径上,Anthropic 的模型生态更强调系统级稳定与 MCP(模型上下文协议)的集成,而 OpenAI 则通过持续调优的推理链探索更强的工程化输出。长远来看,这种竞争将加速“全自动软件工程师”与“自适应多智能体系统(Multi-Agent Systems)”的到来,大模型将不再仅仅是 Agent 的大脑,更将直接充当其生产和渲染运行环境的底层引擎。