DeepSeek-V4 预览版正式发布:百万上下文普惠 AI 时代全面开启
一、发布核心信息
发布时间:2026 年 4 月 24 日 11 时许

发布形式:预览版上线 + 同步开源,支持免费体验与商用 API 调用
体验入口:官网 (chat.deepseek.com)、官方 App、API 接口(开发者改参数即可调用)
核心定位:首个将百万上下文作为标配的开源旗舰模型,实现长文本处理从 "奢侈品" 到 "普惠配置" 的转变
二、双版本策略(MoE 架构)
| 版本 | 总参数 | 激活参数 | 定位 | 核心优势 |
|---|---|---|---|---|
| V4-Pro | 1.6 万亿 | 49B | 性能旗舰 | Agentic Coding 评测开源最佳,数学 / STEM / 竞赛代码超越所有已知开源模型 |
| V4-Flash | 2840 亿 | 13B | 高效经济 | 推理速度更快、成本更低,简单任务推理与 Agent 性能匹配 Pro 版 |
三、三大核心技术突破
1. 百万上下文技术:Hybrid Attention Architecture
融合压缩稀疏注意力 (CSA)与重度压缩注意力 (HCA),在 Token 维度进行压缩
流形约束超连接 (mHC) 增强传统残差连接,提升深层网络长链路计算稳定性
大幅降低计算与显存需求,单 GPU 即可流畅运行 1M 上下文
2. 模型训练与优化
采用Muon 优化器:更快收敛、更高训练稳定性
32T + 高质量 token 预训练,两阶段后训练范式:
领域专家独立培养(SFT+RL with GRPO)
策略蒸馏统一模型整合,融合多领域专长
3. 成本与效率革命
推理成本降至 GPT-4 的1/70,Claude 的1/40
推理速度提升1.8-2 倍,延迟降低65%
显存占用降低60%,支持国产算力适配,推理速度达80tokens/s
四、性能表现
Agent 能力:与主流工具(Claude Code、OpenClaw 等)深度兼容,协同执行效率领先
世界知识:Pro 版储备更丰富,Flash 版在轻量应用中表现出色
推理性能:
V4-Pro 在 GSM8K、MATH 等数学推理数据集超越所有开源模型
代码生成能力对标全球顶尖闭源模型,在 HumanEval、MBPP 等评测中表现优异
长文本处理:一次性处理三本《三体》体量的长文本,信息保持率超 95%
五、开源与应用场景
开源范围:完整模型权重与推理代码开源,支持本地部署与二次开发
核心应用:
企业级文档分析(合同审查、财报解读、法律研究)
软件开发生命周期(代码库理解、大规模重构、自动化测试)
智能体 (Agent) 应用(复杂任务规划、多轮对话、自主决策)
学术研究(文献综述、论文写作、跨领域知识整合)





