新京报客户端

好新闻 无止境

立即打开
DeepSeek“开源周”第二天开源EP通信库
新京报 记者 罗亦丹 编辑 陈莉
2025-02-25 18:29

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。


据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。


DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


编辑 陈莉 校对 柳宝庆

来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
中国AI大模型调用Token量何以连续霸榜
新京号
新模型上线 Meta押注“超级智能”
新京号
2026年首期“全媒介之星”榜单:DeepSeek重回第二,字节、阿里形成角力
科技
一只“龙虾”搅动江湖:国产大模型厂商“吃撑”,大厂急了
科技
这波“养虾潮”还能热多久?
新京号
人工智能一日千里
新京号
探索“第一且唯一”,北大杨仝团队6次获华为奖
新京号
“养龙虾”走红,AI创业叙事的幻觉与真相
科技
代表委员热议人工智能:机器人缺的不是脑子,是“人生经历”
时事
为数字中国建设划定清晰路线 “十五五” 有“数”
新京号

新京报报料邮箱:82708677@bjnews.com.cn