每经记者:岳楚鹏 每经编辑:兰素英OpenAI怎么也没想到,o3还在画饼阶段,中国一夜之间就冒出来两个能和o1打对台的模型。1月20日,月之暗面正式推出多模态思考模型Kimi k1.5,并首次公开该模型的训练技术报告。其中,Kimi k1.
每经记者:郑雨航 每经实习记者:岳楚鹏 每经编辑:兰素英最近大火的深度求索DeepSeek-V3模型仅用557万美元的训练费用,就达到了顶尖模型的效果,而且产品价格低廉,因此被网友们戏称为大模型界的“拼多多”。
惊人的性能提升: DeepSeek-R1-Zero 在 AIME 2024 基准测试上,pass@1 分数从 15.6% 提升到了 71.0%,通过多数投票更是达到了 86.7%,与 OpenAI-01-0912 的表现相当甚至更好。