去年 11 月 20 日,DeepSeek 在官方 Twitter 上发布了 R1 Lite Preview。只有去年 11 月 o1 发布后,有一些人试图复现 o1,这时他们可能对这个 R1 Lite Preview 感兴趣,甚至有人基于它进行一些蒸馏和 SFT 的工作。
最近,DeepSeek 因为 R1 版本开源模型的发布,在外网刷屏了! 这家中国公司究竟是如何炼成的?36 氪旗下的「暗涌」团队两次采访了 DeepSeek 创始人梁文锋,揭开了这家技术理想主义公司的创新密码。### **1.
我本想写一篇关于 DeepSeek R1 的科普文,但发现很多人仅仅把它理解为 OpenAI 的复制品,而忽略了它在论文中揭示的“惊人一跃”,所以,我决定重新写一篇,讲讲从 AlphaGo 到 ChatGPT,再到最近的 DeepSeek R1 底层原理的突破,以及为什么它对所谓的 AGI/ASI 很重要。