每经记者:宋欣悦 每经编辑:陈柯名,兰素英2月26日,DeepSeek宣布开源支持稠密和MoE模型的DeepGEMM(通用矩阵乘法)计算库,可为V3/R1模型的训练和推理提供强大支持。DeepGEMM最大的特点就是简洁高效,仅有300行核心代码。
界面新闻记者 | 宋佳楠2月28日,国内AI明星公司DeepSeek为期五天的 “开源周” 告一段落。其于2月24日正式启动,计划开源5个代码库,旨在以完全透明的方式与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展。
国产AI公司深度求索(DeepSeek)开源周正式启动,并公布首个开源代码。2月24日,DeepSeek宣布启动“开源周”,首个开源的代码库为FlashMLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。
DeepSeek于2025年2月24日正式启动“开源周”,计划连续5天每天开源一个项目。2月21日,DeepSeek发文称,构建了一支探索AGI(通用人工智能)小团队,从下周起将开源5个代码库,以完全透明的方式分享研究进展。
2月24日消息DeepSeek宣布启动“开源周”(Open Source Week)计划连续5天(2月24日至28日)陆续开源5个代码库网友们对此举纷纷点赞称:“DeepSeek王炸开局”“‘源’神启动!
2月27日,DeepSeek宣布开源Optimized Parallelism Strategies。与此同时,英伟达开源了首个在Blackwell架构上优化的DeepSeek-R1,实现了推理速度提升25倍,并且每token成本降低20倍的惊人成果。