DeepSeek V4 技术解读:1.6T 参数、百万 Token 原生上下文与三级推理模式
DeepSeek 于 2026 年 4 月 24 日发布 V4 系列预览版,本文依据官方 API 文档与 Hugging Face 模型卡片,梳理 V4-Pro(1.6T 参数)与 V4-Flash 的规格、架构创新(CSA+HCA 混合注意力、mHC、Muon 优化器)及完整性能基准数据。
DeepSeek 于 2026 年 4 月 24 日发布 V4 系列预览版,本文依据官方 API 文档与 Hugging Face 模型卡片,梳理 V4-Pro(1.6T 参数)与 V4-Flash 的规格、架构创新(CSA+HCA 混合注意力、mHC、Muon 优化器)及完整性能基准数据。