新京报客户端

好新闻 无止境

立即打开
DeepSeek“开源周”第二天开源EP通信库
新京报 记者 罗亦丹 编辑 陈莉
2025-02-25 18:29

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。


据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。


DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


编辑 陈莉 校对 柳宝庆

来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
DeepSeek开源周第三日 发布高性能通用矩阵乘法库
科技
DeepSeek公开利润引服务商互怼 AI基建如何降本
科技
DeepSeek开源周第四日发布:优化并行策略
科技
“咖啡机器人”亮相中关村论坛的幕后:现制饮品的深度智能化
消费
DeepSeek将开源5个代码库:以全透明方式分享进展
科技
要把DeepSeek接入搜索功能?微信回应
科技
马斯克向左 梁文锋向右
科技
双城科创密码:“寻龙诀”与“造海经”
新京号
国产手机扎堆接入DeepSeek AI功能“短板”能否改善
科技
海淀5家创新主体与全国信标委签协议,参与人工智能领域国标制定
北京

新京报报料邮箱:67106710@bjnews.com.cn