IT之家 1 月 20 日消息,幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
来源:信阳日报 今年春节,一股来自东方的“神秘力量”——国产AI大模型DeepSeek,以其强大的智能交互能力迅速风靡全球,成为科技圈热议的焦点。其背后的DeepSeek-R1模型凭借卓越的性能和创新性,展现了中国人工智能技术的巨大潜力,吸引了众多科技公司和用户的关注。
DeepSeek上周发布开源的DeepSeek-R1,并称该模型性能对标OpenAI o1正式版之后,海外AI业界对该模型的讨论还在持续。热议的焦点在于,当开源模型能力赶上最新的闭源模型,可能改变大模型的竞争格局。
财联社2月1日讯(编辑 若宇)上周,中国量化巨头幻方量化旗下大模型公司DeepSeek推出了新模型DeepSeek-R1,该模型在数学、编程和推理等关键领域的表现甚至能媲美OpenAI的最强推理模型o1。
1月26日—27日,短短两天内,国内AI创业公司DeepSeek(深度求索)遭遇两次短暂宕机,DeepSeek将其归因为,新模型发布后导致访问量激增。新模型指的是刚发布的推理大模型DeepSeek-R1,由此带来的访问量有多大?
当硅谷仍在为GPU万卡集群豪掷千亿资金时,来自杭州的一群年轻人用557.6万美元证明:AI大模型的比拼或许并不只靠规模,而是要看使用效率。只要技术实力足够强,一款上架不足半个月的App也能击败ChatGPT,在1月27日登顶苹果应用商店排行榜。