IT之家 1 月 20 日消息,幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
当硅谷仍在为GPU万卡集群豪掷千亿资金时,来自杭州的一群年轻人用557.6万美元证明:AI大模型的比拼或许并不只靠规模,而是要看使用效率。只要技术实力足够强,一款上架不足半个月的App也能击败ChatGPT,在1月27日登顶苹果应用商店排行榜。
以下文章来源于数字生命卡兹克 ,作者数字生命卡兹克。数字生命卡兹克:努力分享一些很新、很酷的AI干货,愿我们永远对世界保持好奇。这两天,DeepSeek-R1火的飞起,在中日美三个Appstore榜上登顶。昨晚,还直接干崩英伟达,盘前先死13个点,连带着台积电一起。
在OpenAI没有披露o1具体技术的情况下,只用了2个月左右的时间,国内大模型公司就跟上了前沿方向的能力:11月16日,月之暗面在发布会上公开了新模型k0 math,通过采用强化学习和思维链推理技术,大模型开始试图模拟人类的思考和反思过程,从而增强其数学推理能力。
硅谷的人工智能霸主们可能没想到,他们最害怕的对手,竟然来自中国。DeepSeek,这家低调的AI实验室,以一场“顿悟时刻”,让整个行业震颤。更少的钱,更强的AI——DeepSeek用一种近乎“作弊”的方式,颠覆了大模型的训练规则。