每经记者:岳楚鹏 每经编辑:兰素英1月20日发布的DeepSeek-R1模型让开发公司DeepSeek在全球的热度持续攀升。1月27日,DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜,甚至超越了大众熟知的ChatGPT。
编辑:桃子 好困【新智元导读】大模型时代,算力即王道。DeepSeek惊艳表现在AI圈掀起巨浪,一个关键问题随之而来:如何以更高效、更经济方式释放潜能?清微智能给出了答案。随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。
在国外大模型排名榜 Chatbot Arena 的基准测试里,DeepSeek-R1 的排名迅速攀升至全类别大模型第三,与 OpenAI 的 ChatGPT-4o 最新版并肩,并且在风格控制类模型分类中,和 OpenAI 的 o1 模型并列第一。其预训练费用仅 557.6 万美元,在 2048 块英伟达 H800 GPU 集群上运行 55 天即可完成训练。