我本想写一篇关于 DeepSeek R1 的科普文,但发现很多人仅仅把它理解为 OpenAI 的复制品,而忽略了它在论文中揭示的“惊人一跃”,所以,我决定重新写一篇,讲讲从 AlphaGo 到 ChatGPT,再到最近的 DeepSeek R1 底层原理的突破,以及为什么它对所谓的 AGI/ASI 很重要。
在编程领域的 Codeforces 评测中,DeepSeek R1 达到了 2441 分的水平,高于 96.3% 的人类参与者 ,在 LiveCodeBench 任务中,DeepSeek R1 取得 65.9% 的 Pass@1 准确率,高于 OpenAI o1-1217 的 63.4%,其评分达到 2029,接近人类顶尖选手,与 OpenAI o1-1217 的 2015 相当,这体现出它在编程能力方面同样出色,能够更好地应对实际编程场景中的挑战。