在国外大模型排名榜 Chatbot Arena 的基准测试里,DeepSeek-R1 的排名迅速攀升至全类别大模型第三,与 OpenAI 的 ChatGPT-4o 最新版并肩,并且在风格控制类模型分类中,和 OpenAI 的 o1 模型并列第一。其预训练费用仅 557.6 万美元,在 2048 块英伟达 H800 GPU 集群上运行 55 天即可完成训练。
2025 年 1 月 20 号,深度求索公司推出了 DeepSeek-R1 模型。开始使用DeepSeek的用户数量急剧增加,导致服务器超负荷运行,官方无法提供稳定的服务,在使用过程中频繁出现“服务器繁忙,请稍后再试”的情况。