DeepSeek V4 正式发布:1.6万亿参数开源旗舰,支持百万 Token 上下文

2026年4月24日,深度求索正式发布并开源其旗舰级模型 DeepSeek V4 系列,分为 V4-Pro 和 V4-Flash 两个版本。V4-Pro 总参数达 1.6 万亿(1.6T),激活参数 490 亿(49B);V4-Flash 总参数 2840 亿(284B),激活参数 130 亿(13B)。两个版本均采用 MoE 架构,原生支持 100 万 token 超长上下文。

DeepSeek V4 的核心突破在于新型 Engram 架构,该设计显著提升了长上下文处理效率,使 V4 能够更高效地处理大量文本。API 定价约为同期竞品的百分之一。V4-Pro 在 MATH-500 基准上达到 90.2%,数学推理能力突出。

2026年6月28日,深度求索联合北京大学发布推理加速框架 DSpark,在 V4-Pro 基础上引入投机解码技术,生产环境吞吐量额外提升 57%-78%,并同步开源全栈工具链 DeepSpec。值得注意的是,DeepSeek V4 在适配升腾芯片的过程中实现了从 CUDA 生态向华为 CANN 架构的底层代码重写,标志着国产 AI 算力生态取得重要进展。

数据来源:MIT Technology Review(2026年4月);DeepSeek 官方公告(2026年6月)

https://www.technologyreview.com/2026/04/24/1136422/why-deepseeks-v4-matters