DeepSeek 发布模型更新

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。

DeepSeek 发布模型更新

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。

其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

微信扫一扫


相关阅读

  • 股民版“GBTI”来了!

    股民版“GBTI”来了!

    股民版 “GBTI”是 2026 年 4 月 10 日爆火的股市人格娱乐测试,全称 Stock Market Big Personality Test,因服务器崩溃刷屏社交圈,主打用自嘲标签解构交易心态与行为。📊 核心速览爆火时间:2026...

    2026.04.13 15:33:48作者:wanshishunyi888

停还是不停?特朗普再发声!

特朗普最新表态(截至 4 月 10 日):停,但有限停;谈,但强硬谈;打,留后手。从 “最后通牒” 到 “临时停火”,再到 “排除黎巴嫩”、施压北约,他在 “战争 — 停火 — 谈判” 间反复切换,核心是极限施压 + 可控避险。一、最新关键...

2026.04.10 15:07:37作者:wanshishunyi888
  • 低温性能碾压锂电(商用化关键)
  • 最近发表
    标签列表