编辑:编辑部 HNYZ【新智元导读】DeepSeek开源第三弹,是支持稠密和MoE模型的FP8计算库——DeepGEMM,支持V3/R1训推。仅凭300行代码,就超过了专家优化的内核。开发者惊叹:DeepSeek有最好的GPU工程师,仿佛拥有某种编译器黑魔法!
每经记者:岳楚鹏 每经编辑:陈柯名,兰素英2月25日,DeepSeek开源周第二波来袭。DeepSeek宣布开源DeepEP的代码库。DeepEP是首个用于混合专家(MoE)模型训练和推理的开源专家并行 (EP)通信库。