新京报客户端

好新闻 无止境

立即打开
DeepSeek开源周第四日发布:优化并行策略
新京报 编辑 寇德娜
2025-02-27 11:40

新京报贝壳财经讯(记者罗亦丹)北京时间2月27日10点5分,DeepSeek发布了其“开源周”第四日的内容:优化的并行策略,其中包括DualPipe,一种用于V3/R1训练中计算与通信重叠的双向管道并行算法, 以及EPLB,一种针对V3/R1的专家并行负载均衡器。


此外,DeepSeek还公开分享了其训练和推理框架的性能分析数据,从而帮助开源社区更好地了解通信与计算重叠策略和底层实现细节。


编辑 寇德娜

校对 王心


相关推荐
DeepSeek发布开源周首个成果 可优化英伟达GPU效率
科技
远大医药连发创新药进展引资本关注,5个交易日股价涨幅超38%
消费
AI浪潮录丨人工智能为什么是年轻人的事业?专访95后师天麾
科技
生数科技朱军:视频模型下一步是高可控,中国视频大模型引领全球
科技
DeepSeek“开源周”第二天开源EP通信库
科技
DeepSeek开源周第五日:开源快速读取“推进器”
科技
“咖啡机器人”亮相中关村论坛的幕后:现制饮品的深度智能化
消费
一轻控股发布兴汉网际AI智算一体机 京企助力行业智能化升级
科技
游族网络去年营收14.34亿元 长线游戏流水逆势增长
科技
DeepSeek公开利润引服务商互怼 AI基建如何降本
科技

新京报报料邮箱:67106710@bjnews.com.cn