DeepSeek-V4 预览版正式发布：百万上下文普惠 AI 时代全面开启

核心速览：2026 年 4 月 24 日，DeepSeek（深度求索）正式发布并开源新一代大模型DeepSeek-V4 预览版，全系标配100 万字（1M tokens）超长上下文，采用 MoE 架构双版本策略，在 Agent 能力、推理性能与成本效率上实现突破性提升，同步开放官网 / APP 体验与 API 商用调用。

一、发布核心信息

发布时间：2026 年 4 月 24 日 11 时许
发布形式：预览版上线 + 同步开源，支持免费体验与商用 API 调用
体验入口：官网 (chat.deepseek.com)、官方 App、API 接口（开发者改参数即可调用）
核心定位：首个将百万上下文作为标配的开源旗舰模型，实现长文本处理从 "奢侈品" 到 "普惠配置" 的转变

二、双版本策略（MoE 架构）

版本	总参数	激活参数	定位	核心优势
V4-Pro	1.6 万亿	49B	性能旗舰	Agentic Coding 评测开源最佳，数学 / STEM / 竞赛代码超越所有已知开源模型
V4-Flash	2840 亿	13B	高效经济	推理速度更快、成本更低，简单任务推理与 Agent 性能匹配 Pro 版

三、三大核心技术突破

1. 百万上下文技术：Hybrid Attention Architecture

融合压缩稀疏注意力 (CSA)与重度压缩注意力 (HCA)，在 Token 维度进行压缩
流形约束超连接 (mHC) 增强传统残差连接，提升深层网络长链路计算稳定性
大幅降低计算与显存需求，单 GPU 即可流畅运行 1M 上下文

2. 模型训练与优化

采用Muon 优化器：更快收敛、更高训练稳定性
32T + 高质量 token 预训练，两阶段后训练范式：

领域专家独立培养（SFT+RL with GRPO）
策略蒸馏统一模型整合，融合多领域专长

3. 成本与效率革命

推理成本降至 GPT-4 的1/70，Claude 的1/40
推理速度提升1.8-2 倍，延迟降低65%
显存占用降低60%，支持国产算力适配，推理速度达80tokens/s

四、性能表现

Agent 能力：与主流工具（Claude Code、OpenClaw 等）深度兼容，协同执行效率领先
世界知识：Pro 版储备更丰富，Flash 版在轻量应用中表现出色
推理性能：

V4-Pro 在 GSM8K、MATH 等数学推理数据集超越所有开源模型
代码生成能力对标全球顶尖闭源模型，在 HumanEval、MBPP 等评测中表现优异

长文本处理：一次性处理三本《三体》体量的长文本，信息保持率超 95%

五、开源与应用场景

开源范围：完整模型权重与推理代码开源，支持本地部署与二次开发
核心应用：

企业级文档分析（合同审查、财报解读、法律研究）
软件开发生命周期（代码库理解、大规模重构、自动化测试）
智能体 (Agent) 应用（复杂任务规划、多轮对话、自主决策）
学术研究（文献综述、论文写作、跨领域知识整合）

六、一句话总结

DeepSeek-V4 预览版以百万上下文标配 + MoE 双版本 + 架构级优化，推动 AI 从 "短文本交互" 迈向 "长文本理解与推理" 的普惠时代，为开源社区与企业应用提供了高性能、低成本的全新选择。

DeepseekV4预览版本发布！

DeepSeek-V4 预览版正式发布：百万上下文普惠 AI 时代全面开启

一、发布核心信息

二、双版本策略（MoE 架构）

三、三大核心技术突破

1. 百万上下文技术：Hybrid Attention Architecture

2. 模型训练与优化

3. 成本与效率革命

四、性能表现

五、开源与应用场景

六、一句话总结

中旬（5.11–5.20）：核心高潮・回收大考

五月国内外商业火箭密集发射

最近发表

标签列表

DeepseekV4预览版本发布！

DeepSeek-V4 预览版正式发布：百万上下文普惠 AI 时代全面开启

一、发布核心信息

二、双版本策略（MoE 架构）

三、三大核心技术突破

1. 百万上下文技术：Hybrid Attention Architecture

2. 模型训练与优化

3. 成本与效率革命

四、性能表现

五、开源与应用场景

六、一句话总结

相关阅读

最近发表

标签列表