1月31日,英伟达网站显示,DeepSeek R1 671b已作为英伟达NIM微服务预览版在build.nvidia.com上发布。DeepSeek R1 NIM微服务在单个英伟达HGX H200系统上每秒最多可处理3872个token。
2025年1月20日,中国初创企业深度求索(DeepSeek)推出开源大模型DeepSeek-R1。“极低成本对标顶尖性能”的技术突破,引得一众硅谷科技巨头连夜发声。短短一周内,DeepSeek登顶全球140个市场的应用商店下载榜,甚至因访问量过载一度“崩服”。