DeepSeek 发布模型更新

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。

DeepSeek 发布模型更新

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。

其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

微信扫一扫


相关阅读

  • 重磅!华为韬定律发布!

    重磅!华为韬定律发布!

    华为重磅发布 “韬 (τ) 定律”:中国首提半导体产业新范式,改写后摩尔时代规则核心速览(2026.5.25)发布时间:2026 年 5 月 25 日,上海 ISCAS 2026 国际电路与系统研讨会华为发布人:华为董事、半导体业务部总裁何...

    2026.05.26 16:56:57作者:wanshishunyi888
  • 超百股涨停,沪指重返4100点

    超百股涨停,沪指重返4100点

    核心速览(2026.5.22)沪指 + 0.87% 收 4112.90 点,站稳 4100 点,深成指 **+2.30%,创业板指+2.84%,科创 50+1.51%**超 3600 只个股上涨,涨停约77 家,沪深京三市成交额2.9 万亿...

    2026.05.22 16:55:24作者:wanshishunyi888
  • 国民经济运行情况新闻发布会

    国民经济运行情况新闻发布会

    2026 年 4 月国民经济运行情况(5 月 18 日发布会)核心结论:生产稳、就业稳、物价稳,新动能强,内需偏弱、外需亮眼,经济整体稳中有进、向新向优国家统计局。一、核心数据(1–4 月 / 4 月单月)1. 生产端(工业 + 服务业)规...

    2026.05.18 15:53:38作者:wanshishunyi888
  • 国家主席习近平同美国总统特朗普会谈

    国家主席习近平同美国总统特朗普会谈

    一、会晤基本信息(2026.5.14–15,北京)时间:5 月 14 日(人民大会堂正式会谈)、5 月 15 日(中南海小范围会晤)今日头条背景:特朗普时隔 9 年再次访华,定位为中美建设性战略稳定关系今日头条二、中方核心立场新定位:共建...

    2026.05.15 14:20:51作者:wanshishunyi888
  • 秘鲁发布能源危机紧急法令

    秘鲁发布能源危机紧急法令

    秘鲁发布第 003-2026 号能源危机紧急法令(2026.5.11)秘鲁临时总统何塞・巴尔卡萨尔于5 月 11 日签署并发布第 003-2026 号紧急法令,宣布全国进入能源供应紧急状态,有效期至2026 年 12 月 31 日。这是继...

    2026.05.12 10:33:00作者:wanshishunyi888

中旬(5.11–5.20):核心高潮・回收大考

最近发表
标签列表