新京报客户端

好新闻 无止境

立即打开
DeepSeek“开源周”第二天开源EP通信库
新京报 记者 罗亦丹 编辑 陈莉
2025-02-25 18:29

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。


据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。


DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


编辑 陈莉 校对 柳宝庆

来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
创大模型价格新低!DeepSeek API输入缓存降至首发价十分之一
新京号
Agentic AI爆发,华为给出国产算力系统性解法
科技
海外AI圈“大V”36小时中国行:在北京,有一种更浓的“生态感”
科技
赛迪刘权:全球在用模型65%来自中国,中美差距已缩至1.7%
科技
「改革创新」余晓晖:准确把握人工智能发展前沿与竞争格局
新京号
北交所“百元股”创下新高,“百亿身家”总市值公司数量倍增
北交所
如何把握本轮“鱼尾行情”?投资主线有哪些?十大券商策略来了
新京号
透视年报|营收增超2.4倍,为何“国产GPU第一股”还是亏?
财经
新模型上线 Meta押注“超级智能”
新京号
朝气蓬勃的年轻人投身火热的年轻事业!一年来,申城大模型生态加快成势
新京号

新京报报料邮箱:82708677@bjnews.com.cn