我本想写一篇关于 DeepSeek R1 的科普文,但发现很多人仅仅把它理解为 OpenAI 的复制品,而忽略了它在论文中揭示的“惊人一跃”,所以,我决定重新写一篇,讲讲从 AlphaGo 到 ChatGPT,再到最近的 DeepSeek R1 底层原理的突破,以及为什么它对所谓的 AGI/ASI 很重要。
21世纪经济报道记者 赵娜 上海报道1月20日,中国人工智能公司深度求索(DeepSeek)发布开源模型DeepSeek-R1,一举成为全球科技行业的焦点。DeepSeek的这一突破引起了众多风险投资人和科技创业者的关注。
封面新闻记者 朱宁 边雪 陈甘露距离深度求索(DeepSeek)推理大模型DeepSeek-R1发布已经过去近一周时间,开源模型DeepSeek-V3也已经发布了近一个月。然而,在海外社交媒体平台乃至华尔街,DeepSeek的热度才刚刚开始。