每经记者:岳楚鹏 每经编辑:兰素英2月10日,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛。此前,拥有671B参数的MoE架构大模型DeepSeek-R1在推理时困难重重。
来自加拿大的小哥在平台上晒出了自己在 eBay 上买的 RTX 4090 48G,让网友给出测试建议。不过,Slamtec 创始人兼 CTO Tony Huang 对此在推特上表示,“这应该不可能,4090 的上限就是 384bit/16bit*16Gbit GDDR6 = 48G”。
21世纪经济报道记者骆轶琪 广州报道AI基础设施建设再度迎来高峰,由此引发产业链层面的价格抬升。近日,国盛证券发布报告指出,云计算、IDC、服务器、GPU及算力租赁等领域均在不同程度上出现价格上升的信号,验证了云上游行业景气度提升。