2025年1月31日,英伟达官网宣布,推理开放模型DeepSeek R1正式在NVIDIA NIM平台上提供预览版,这意味着DeepSeek R1模型已作为NVIDIA NIM微服务预览版在英伟达开发者平台上线,双方开启了技术合作。
1月31日,英伟达网站显示,DeepSeek R1 671b已作为英伟达NIM微服务预览版在build.nvidia.com上发布。DeepSeek R1 NIM微服务在单个英伟达HGX H200系统上每秒最多可处理3872个token。