4090D能做deepseek

资讯

4090显卡单枪匹马就能跑满血版DeepSeek-R1，清华团队突破大模型算力难题
每经记者：岳楚鹏每经编辑：兰素英2月10日，清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新，成功打破大模型推理算力门槛。此前，拥有671B参数的MoE架构大模型DeepSeek-R1在推理时困难重重。
每日经济新闻
116评论
清华团队突破大模型算力瓶颈：4090单卡实现DeepSeek-R1满血运行
如图所示，KTransformers 团队于 2 月 10 日成功在 24G 显存 + 382 GB 内存的 PC 上实现本地运行 DeepSeek-R1、V3 的 671B 满血版，速度提高 3~28 倍。
IT之家
353评论
清华团队突破算力难题：4090显卡单枪匹马就能跑“满血版”DeepSeek-R1！有用户称整套方案成本不到7万元，直降95%以上
2月10日，清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目公布更新:一块24G显存的4090D就可以在本地运行DeepSeek-R1、V3的671B“满血版”。
每日经济新闻
411评论
DeepSeek带火英伟达GPU，禁售型号被抢空，国产GPU大招在后头
文/王新喜经济观察报报道一条消息，一位英伟达代理商告诉经济观察网记者，春节后第一周，两家中国科技企业为支撑开源大模型DeepSeek的推理服务，紧急向他们公司采购了L20 GPU算力设备。“去年，客户下单总要反复考虑和比价，现在连库存的禁售型号都抢空了”。
王新喜
1评论

视频