新京报客户端

好新闻 无止境

立即打开
DeepSeek“开源周”第二天开源EP通信库
新京报 记者 罗亦丹 编辑 陈莉
2025-02-25 18:29

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。


据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。


DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


编辑 陈莉 校对 柳宝庆

来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
上半年工业增加值增长超6% AI终端成为拉动经济发展新增长点
科技
美国解禁H20芯片AB面,黄仁勋一年三次来华的“芯”事
科技
平安好医生入选首批“开源大模型+”创新应用典型案例
商讯
“被迫”用上了AI之后,公务员的工作更忙了
新京号
锚定“好用”!诚迈科技重磅发布五大信创产品矩阵,共建自主共赢生态
企业资讯
世界机器人大会上演足球大战,揭秘世界杯冠军机型为何这么强?
时事
金融壹账通智能客服机器人实现7×24小时在线,重塑运营成本结构
企业资讯
2025WAIC,这家“AI 新国企”六大行业落地样本引围观
企业资讯
智源研究院发布“悟界”系列大模型,推动AI迈向物理世界
北京
科技赋能互联网医疗新生态:方舟云康的AI医疗创新实践
企业资讯

新京报报料邮箱:67106710@bjnews.com.cn