来源:【四川日报-川观新闻】川观智库研究员 李媛莉当全球科技巨头围绕“千亿参数大模型”展开竞赛时,来自中国的DeepSeek(深度求索)却以“低成本、高性能、全开源”的策略,成为搅动行业格局的颠覆者。DeepSeek是什么?究竟有哪些重大影响及意义?
每经AI快讯,国泰君安指出,DeepSeek发布R1开源模型。R1开源模型在后训练阶段大规模使用强化学习技术,在仅有很少标注数据的情况下极大的提升了模型的推理能力,在数学/代码/自然语言推理等任务上性能比肩OpenAIo1,且采用蒸馏技术显著提升小模型性能。