2025 年春节,AI 圈可是炸开了锅,主角就是中国 AI 公司 DeepSeek 推出的最新模型。在这股热潮中,清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室编写的《DeepSeek:从入门到精通》,就像一场及时雨,给众多渴望深入了解和运用 DeepSeek 的人带来了福音。
如图所示,KTransformers 团队于 2 月 10 日成功在 24G 显存 + 382 GB 内存的 PC 上实现本地运行 DeepSeek-R1、V3 的 671B 满血版,速度提高 3~28 倍。
每经记者:岳楚鹏 每经编辑:兰素英2月10日,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛。此前,拥有671B参数的MoE架构大模型DeepSeek-R1在推理时困难重重。