DeepSeek V4 正式发布：1.6万亿参数开源旗舰，支持百万 Token 上下文

2026年7月1日

2026年4月24日，深度求索正式发布并开源其旗舰级模型 DeepSeek V4 系列，分为 V4-Pro 和 V4-Flash 两个版本。V4-Pro 总参数达 1.6 万亿（1.6T），激活参数 490 亿（49B）；V4-Flash 总参数 2840 亿（284B），激活参数 130 亿（13B）。两个版本均采用 MoE 架构，原生支持 100 万 token 超长上下文。

DeepSeek V4 的核心突破在于新型 Engram 架构，该设计显著提升了长上下文处理效率，使 V4 能够更高效地处理大量文本。API 定价约为同期竞品的百分之一。V4-Pro 在 MATH-500 基准上达到 90.2%，数学推理能力突出。

2026年6月28日，深度求索联合北京大学发布推理加速框架 DSpark，在 V4-Pro 基础上引入投机解码技术，生产环境吞吐量额外提升 57%-78%，并同步开源全栈工具链 DeepSpec。值得注意的是，DeepSeek V4 在适配升腾芯片的过程中实现了从 CUDA 生态向华为 CANN 架构的底层代码重写，标志着国产 AI 算力生态取得重要进展。

数据来源：MIT Technology Review（2026年4月）；DeepSeek 官方公告（2026年6月）

https://www.technologyreview.com/2026/04/24/1136422/why-deepseeks-v4-matters