1月28日,OpenAI首席执行官山姆·奥特曼在社交平台X上表示,DeepSeek(深度求索)的R1模型“令人印象深刻”,尤其是考虑到以这个价格提供的功能。他表示OpenAI“当然会推出更好的模型”,有新的竞争对手也确实令人振奋。
【文/观察者网 陈思佳】这两天,中国人工智能公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。这一成果引发全球科技行业高度关注,西方媒体也发文感叹“中国AI模型震惊硅谷”。
IT之家 1 月 20 日消息,幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
而在成本方面,DeepSeek-R1 更是展现出了巨大的优势,其预训练费用只有 557.6 万美元,在 2048 块英伟达 H800 GPU 集群上运行 55 天即可完成,仅是 OpenAI GPT-4o 模型训练成本的不到十分之一。
作为一位深耕人工智能领域多年的技术先锋,梁文锋在接受媒体采访时曾表示:“中国AI不能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者。”
每经记者:岳楚鹏 每经编辑:兰素英1月20日发布的DeepSeek-R1模型让开发公司DeepSeek在全球的热度持续攀升。1月27日,DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜,甚至超越了大众熟知的ChatGPT。