我本想写一篇关于 DeepSeek R1 的科普文,但发现很多人仅仅把它理解为 OpenAI 的复制品,而忽略了它在论文中揭示的“惊人一跃”,所以,我决定重新写一篇,讲讲从 AlphaGo 到 ChatGPT,再到最近的 DeepSeek R1 底层原理的突破,以及为什么它对所谓的 AGI/ASI 很重要。
例如,在 AIME 2024 这类数学测试中,DeepSeek-R1-Zero 的 pass@1 准确率从 15.6% 飙升至 71.0%,通过多数投票策略还能进一步提高到 86.7%,水平可与 OpenAI-o1-0912 媲美。
近日中国AI大模型创业公司DeepSeek(深度求索)正式发布DeepSeek-R1大模型1月27日苹果App Store中国区免费榜显示DeepSeek站上首位同时其在美区苹果App Store免费榜从26日的第六位飚升至第一位超越ChatGPT、Meta旗下社交媒体平台Thr