然而,最近由清华大学KVCache.AI团队和趋境科技联合发布的KTransformers项目,带来了一项令人振奋的突破:只需一块24G显存的4090显卡,就能在本地顺畅运行DeepSeek-R1的671B“满血版”。
每经记者:岳楚鹏 每经编辑:兰素英2月10日,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛。此前,拥有671B参数的MoE架构大模型DeepSeek-R1在推理时困难重重。
前两天,马斯克旗下的AI公司xAI,发布了其最新的AI大模型,也就是Grok3,以发布会上,马斯克称其是全球最聪明的AI。而从各种测试对比来看,Grok3,也确实很厉害,比OpenAI、Deepseek的得分更高。
《Grok3数学实力碾压DeepSeek?实测结果太“意外”了》 马斯克再放大招!Grok3“称霸”AI圈? 哇塞!马斯克这次又在AI圈扔下一颗超级炸弹啦!2025年2月18日,他带着xAI团队搞出的动静,简直就像“硅谷版春晚”!