⚡ News

阿里发布Qwen3.7-Max:主打推理Agent,支持100万长上下文

阿里发布Qwen3.7-Max:主打推理Agent,支持100万长上下文

目前大多数AI模型并非为持续、多步的自主执行而设计。诸如运行数百次迭代代码修改,或在数小时内无需人工干预地链式调用工具,这类任务需要完全不同的模型架构和训练重点。在2026年5月20日的阿里云峰会上,通义千问团队正式发布了Qwen3.7-Max。

此前,Qwen3.7系列的两个预览版本已低调出现在Arena AI排行榜上。根据LM Arena的数据,Qwen3.7-Max-Preview在文本能力上位列全球第13名(实验室排名第6),而Qwen3.7-Plus-Preview在视觉能力上位列第16名(实验室排名第5)。Qwen3.7-Plus-Preview定位为高性能平衡版,侧重于推理与逻辑表达,并支持多模态输入;而Qwen3.7-Max则是纯文本的推理旗舰模型,也是本次正式开放API接口的主角。

通义千问团队将Qwen3.7-Max描述为迄今为止最先进、最全面的Agent模型。该模型为闭源商业模型,能够处理编码与调试、办公流程自动化,以及跨越数百甚至数千步的长期任务。其核心特性是“扩展思考模式”(Extended-Thinking Mode),即模型会先生成内部思维链(CoT),在输出最终答案前进行计划、检查和纠错。

这种推理模型产生的输出Token显著多于标准模型。在Artificial Analysis的评估中,Qwen3.7-Max生成了约9700万Token,而基准测试模型的平均值仅为2400万。虽然这种开销增加了简单任务的延迟,但在多步规划、代码重构或长链路Agent场景下,扩展思考模式正是其核心优势所在。

此外,Qwen3.7-Max将上下文窗口从Qwen3.6 Max Preview的256K大幅提升至100万Token。百万级窗口允许在单次请求中放入完整的中型代码仓库或大量文档堆栈。尽管目前尚未公布正式定价,但作为参考,Qwen3.6 Max预览版在阿里云上的定价为每百万输入/输出Token分别为1.30美元和7.80美元。

↗ 阅读原文