惊人的性能提升: DeepSeek-R1-Zero 在 AIME 2024 基准测试上,pass@1 分数从 15.6% 提升到了 71.0%,通过多数投票更是达到了 86.7%,与 OpenAI-01-0912 的表现相当甚至更好。
我本想写一篇关于 DeepSeek R1 的科普文,但发现很多人仅仅把它理解为 OpenAI 的复制品,而忽略了它在论文中揭示的“惊人一跃”,所以,我决定重新写一篇,讲讲从 AlphaGo 到 ChatGPT,再到最近的 DeepSeek R1 底层原理的突破,以及为什么它对所谓的 AGI/ASI 很重要。
例如,在 AIME 2024 这类数学测试中,DeepSeek-R1-Zero 的 pass@1 准确率从 15.6% 飙升至 71.0%,通过多数投票策略还能进一步提高到 86.7%,水平可与 OpenAI-o1-0912 媲美。
奥特曼、OpenAI首席研究官不得不发文承认DeeSeek的技术突破,预告未来会加快新模型的发布。就连奥特曼本人也不得不打破沉默,公开承认DeepSeek的实力,并剧透了未来会有更多模型的发布:DeepSeek R1是一款令人印象深刻的模型,特别是考虑到他们在这个价格范围内能够提供的能力。
来源:市场资讯来源:AI智见录 “马斯克评论: “有趣的分析。我所见过的最好的。” “AI 将无处不在。”DeepSeek r1 的真相与细节真实情况: 它在相关 App Store 类别中下载量排名第一。