每经记者:宋欣悦 每经编辑:陈柯名,兰素英2月26日,DeepSeek宣布开源支持稠密和MoE模型的DeepGEMM(通用矩阵乘法)计算库,可为V3/R1模型的训练和推理提供强大支持。DeepGEMM最大的特点就是简洁高效,仅有300行核心代码。
2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。据介绍,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。
2月25日,开源放福利的DeepSeek甩出了一张王炸——开源全球首个面向MoE模型的全栈通信库DeepEP。因为直接解决了AI算力焦虑,GitHub瞬间飙出1500星(指收藏量),圈内集体炸锅,其重要性可见一斑。很多人好奇DeepEP意味着什么?
最近,DeepSeek又“出大招”了。2025年2月24日,DeepSeek宣布正式启动“开源周”,计划连续5天每天开源一个项目。24日,DeepSeek放出了首个开源项目,名为FlashMLA,可以理解为专门为高性能显卡(HopperGPU)设计的“AI加速工具”。