编辑:编辑部 HNYZ【新智元导读】DeepSeek开源第三弹,是支持稠密和MoE模型的FP8计算库——DeepGEMM,支持V3/R1训推。仅凭300行代码,就超过了专家优化的内核。开发者惊叹:DeepSeek有最好的GPU工程师,仿佛拥有某种编译器黑魔法!
据台湾“中央社”2月26日引述路透社消息报道,大陆人工智能初创公司深度求索(DeepSeek)原本计划今年5月初发布新一代人工智能模型R2,但现在希望能尽早发布。对此,深度求索所属的幻方量化表示,“以官方消息为准”。
DeepSeek又传来重磅消息。 2月25日,据路透社报道,DeepSeek计划提前发布其新一代AI模型R2。该公司最初计划在5月推出,但目前正在努力尽快推出。DeepSeek表示,新模型将在编程能力和多语言推理方面有所提升。