每经评论员 杜恒峰1月20日,中国人工智能初创企业DeepSeek发布最新模型“DeepSeek-R1”(以下简称R1),这一举动引起了全球AI行业的广泛关注。R1的发布不仅表明中国AI企业在国际舞台崭露头角,还展示了中国在人工智能领域的巨大潜力。
完整训练成本仅 557.6 万美元,使用的 GPU 小时数为 278.8 万 ,与 Llama 3 高达 1 亿美元的训练成本,以及 GPT-4o 可能高达 10 亿美元的预算相比,DeepSeek V3 的成本优势简直一目了然,也难怪被大家称为 “国货之光”。
由于云计算业务增速下滑和疲软的业绩指引,科技巨头微软股价在财报后走低。当地时间1月29日,微软公布截至2024年12月31日的2025财年第二财季业绩,第二财季营收696.32亿美元,高于市场预期的687.8亿美元,同比增长12%;净利润同比增长10%至241.
1月20日,该公司发布推理大模型DeepSeek-R1,仅用OpenAI十分之一的训练成本,实现了比肩甚至超越GPT-4o、Claude-3.5等顶尖闭源模型的性能,在数学、代码和自然语言推理等任务上表现卓越,且完全开源,支持免费商用。
深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。
来源:市场资讯来源:AI智见录 “马斯克评论: “有趣的分析。我所见过的最好的。” “AI 将无处不在。”DeepSeek r1 的真相与细节真实情况: 它在相关 App Store 类别中下载量排名第一。