News

Anthropic发布Claude Opus 4.7:视觉、记忆与指令遵循能力大幅升级

Anthropic发布Claude Opus 4.7:视觉、记忆与指令遵循能力大幅升级

Anthropic 近日正式发布了其旗舰模型 Claude Opus 4.7,作为 Opus 4.6 的直接升级版,新模型在处理复杂、长期任务方面有望超越前代。然而,Anthropic 也指出,其通用能力可能不及上周发布的神秘内测版本 Claude Mythos Preview。

Claude Opus 4.7 已全面应用于所有 Claude 产品、Anthropic API 平台,以及亚马逊 Bedrock、谷歌云 Vertex AI 和微软 Foundry 等主流云服务,定价与 Opus 4.6 保持一致。Anthropic 官方表示,Opus 4.7 在指令遵循、视觉理解、创造力、记忆力及金融分析能力上均有显著提升。

Opus 4.7 核心能力增强

Anthropic 称,包括 Intuit、GitHub 和 Notion 在内的 Opus 4.7 早期测试用户反馈积极。其中一项重要改进是指令遵循能力的提升。相较于以往 Claude 模型可能“揣摩”用户意图或完全忽略指令的情况,新版本能更严格地遵循用户指示。

值得注意的是,Anthropic 提到,由于这一能力增强,为早期模型编写的提示词(prompts)在 Opus 4.7 上可能会产生意想不到的结果。这意味着用户可能需要调整提示词编写风格,以适应 Opus 4.7 更为字面化的指令遵循方式。

模型在处理高分辨率图像方面的视觉能力也得到增强。Opus 4.7 现在可接受比之前版本多三倍像素的图像,这为依赖精细视觉细节的应用场景带来了更多可能性,例如准确解读密集的屏幕截图。

在创意和“品味”方面,Anthropic 模糊地形容 Opus 4.7 在完成专业任务时“更具品味和创造力”。部分早期测试用户的反馈也印证了这一点,他们认为新模型能生成“更高质量”的界面、幻灯片和文档。Triple Whale 联合创始人兼 CEO Aj Orbach 评价道:“它的设计品味令人惊喜,生成的效果我可以直接投入使用。”

Opus 4.7 的另一亮点是记忆力的显著增强。Anthropic 宣布,新模型“更擅长使用基于文件系统的记忆”,使其能够在不同任务之间记住并引用此前的笔记和上下文,从而减少用户重复提供背景信息的负担。

最后,Anthropic 在其公告博客中强调,Opus 4.7 在 GDPval-AA 这一第三方评估中表现卓越,该评估旨在测试大型语言模型在金融、法律等领域解决真实世界、具有经济价值任务的能力。Anthropic 内部测试也表明,得益于更严谨的分析和更专业的输出,Opus 4.7 作为金融分析师比 Opus 4.6 更加高效。

↗ 阅读原文