性能评估结果显示,通过纯强化学习方法训练得到的 DeepSeek-R1-Zero以及在此基础上改进的 DeepSeek-R1,在 2024 年AIME测试中分别取得了 71.0% 和 79.8% 的成绩,与 OpenAI o1 的79.2%水平可谓并驾齐驱。
本文来自微信公众号:字母榜,作者:赵晋杰,题图来源:AI生成DeepSeek的压力,终于还是传递到了黄仁勋身上。北京时间1月27日晚,英伟达美股股价盘前暴跌近11%,按目前市值34928亿美元计算,英伟达市值恐将缩水超3500亿美元。
IT之家 1 月 20 日消息,幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。