新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。
新京报贝壳财经讯(记者罗亦丹)北京时间2月27日10点5分,DeepSeek发布了其“开源周”第四日的内容:优化的并行策略,其中包括DualPipe,一种用于V3/R1训练中计算与通信重叠的双向管道并行算法, 以及EPLB,一种针对V3/R1的专家并行负载均衡器。
2月24日消息DeepSeek宣布启动“开源周”(Open Source Week)计划连续5天(2月24日至28日)陆续开源5个代码库网友们对此举纷纷点赞称:“DeepSeek王炸开局”“‘源’神启动!
DeepSeek于2025年2月24日正式启动“开源周”,计划连续5天每天开源一个项目。2月21日,DeepSeek发文称,构建了一支探索AGI(通用人工智能)小团队,从下周起将开源5个代码库,以完全透明的方式分享研究进展。
【财经日历】韩国央行公布利率决议。周一,美国三大股指涨跌互现,截至收盘,道指涨33.19点,涨幅0.08%,报43461.21点,纳指跌1.21%,报19286.92点,回吐年内所有涨幅,标普500指数跌0.50%,报5983.25点。个股方面,半导体板块承压,英伟达跌3.
2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。据介绍,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。