DeepSeek-V4重磅发布：百万Token上下文，华为云首发适配

2026年4月24日，备受期待的DeepSeek-V4模型正式发布并开源，华为云宣布首发适配。DeepSeek-V4在多项关键能力上实现了国内与开源领域的领先，尤其突出的是其百万Token的超长上下文处理能力，以及在AI Agent能力、世界知识和推理性能上的显著提升。

此次发布的DeepSeek-V4模型系列中，DeepSeek-V4-Flash版本备受关注。其参数量优化至284B，不仅显著降低了推理成本，更以更小的模型参数和激活量，提供了更加快捷、经济的API服务，有效推动了百万Token上下文的普惠应用。

华为云MaaS（模型即服务）平台目前已为广大开发者提供了便捷服务，支持免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。为确保此次新模型的快速适配与高性能落地，华为云在系统层、算子层和集群层进行了深度协同，分别从调度效率、计算效率和数据流转效率三个维度进行了全面优化。

针对DeepSeek-V4的独特架构，华为云率先适配了模型分层注意力压缩机制，实现了在V4注意力机制下KVCache的高效分配与管理。同时，华为云还提供了TopK、SWA、CFA等超过10种昇腾高性能融合算子，并结合框架异步调度、MTP（多步投机）等多步投机执行等框架优化，确保了原生百万Token长上下文的高性能推理。

华为云致力于以高效的AI基础设施为核心，打造“硅基黑土地”生态，开放接纳包括自研和第三方主流大模型以及众多智能体。此举旨在帮助企业有效解决难题，显著提升生产效率。据悉，金山办公和360等知名企业已通过华为云接入DeepSeek新模型。此外，DeepSeek-V4-Pro版本也预计将于近日上线，带来更多期待。