金色财经报道,DeepSeek开源周第二天,很高兴介绍 DeepEP – 第一个用于 MoE 模型训练和推理的开源 EP 通信库。高效且优化的全对全通信通过 NVLink 和 RDMA 支持节点内和节点间用于训练和推理预填充的高吞吐量内核用于推理解码的低延迟内核原生 FP8 调度支持灵活的 GPU 资源控制,用于计算通信重叠
Δ