新京报贝壳财经讯 2月20日,据“昆仑芯科技”公号显示,百度旗下的昆仑芯P800在国产AI芯片中首发支持单机部署DeepSeek V3/R1671B满血版大模型,包括8卡和16卡两种配置,总吞吐最高为每秒4825tokens。
DeepSeek爆火,从个人开发者到企业客户,各类DeepSeek应用需求激增。京东云围绕四大需求场景,全面上线DeepSeek产品,从公用云到私有化部署,再到智算服务,全方位适配不同体量、不同行业客户对DeepSeek的需要。
如图所示,KTransformers 团队于 2 月 10 日成功在 24G 显存 + 382 GB 内存的 PC 上实现本地运行 DeepSeek-R1、V3 的 671B 满血版,速度提高 3~28 倍。