自2025年1月20日发布以来,DeepSeek R1如同一颗“东方核弹”引爆了全球AI圈。在社交媒体X上,#DeepSeek话题刷屏,硅谷程序员自嘲“老板让我学DeepSeek的代码注释”,还有网友造梗“550万美元训练费≈硅谷码农一年工资。
IT之家 1 月 20 日消息,幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
当硅谷仍在为GPU万卡集群豪掷千亿资金时,来自杭州的一群年轻人用557.6万美元证明:AI大模型的比拼或许并不只靠规模,而是要看使用效率。只要技术实力足够强,一款上架不足半个月的App也能击败ChatGPT,在1月27日登顶苹果应用商店排行榜。
Deepseek从一开始给世界一个惊艳,华尔街的股市暴跌,金融大佬们纷纷探出脑袋冒泡,再后来,全世界纷纷开始下载安装Deepseek,Deepseek真的像自己所说的深度思考,他最有特点的将思考过程展示出来,完全超出了我们的想象。