
3月10日,字节豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。据悉,该技术已实际应用于字节的万卡集群训练,累计帮助节省了数百万GPU小时训练算力。

3月10日,字节豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。据悉,该技术已实际应用于字节的万卡集群训练,累计帮助节省了数百万GPU小时训练算力。
5 月中下旬 文昌:蓝箭航天・朱雀三号遥二复飞,冲刺一子级垂直软着陆回收(民营液体火箭成败关键,对标猎鹰 9 号)。
2026 年 5 月,全球商业航天迎来高密度发射窗口:国内集中冲刺可回收火箭里程碑,海外 SpaceX、亚马逊等密集组网与空间站部署,全月至少15 + 次关键发射,堪称 “商业航天超级五月”。一、国内:可回收火箭决战月(5 月)上旬(5.1...
四月收官战!成长狂欢,科创暴走 ——4 月战绩全解析一、4 月 30 日收官日:窄幅震荡,科技炸裂上证指数:4112.16 点,+0.11%,成交 1.28 万亿,站稳 4100 点整数关口深证成指:15107.55 点,-0.09%,成交...
DeepSeek-V4 预览版正式发布:百万上下文普惠 AI 时代全面开启核心速览:2026 年 4 月 24 日,DeepSeek(深度求索)正式发布并开源新一代大模型DeepSeek-V4 预览版,全系标配100 万字(1M token...