完整训练成本仅 557.6 万美元,使用的 GPU 小时数为 278.8 万 ,与 Llama 3 高达 1 亿美元的训练成本,以及 GPT-4o 可能高达 10 亿美元的预算相比,DeepSeek V3 的成本优势简直一目了然,也难怪被大家称为 “国货之光”。
在专业的大模型排名 Arena 上,DeepSeek - R1 基准测试成绩斐然,已升至全类别大模型第三 ,其中在风格控制类模型 分类中与 OpenAI o1 并列第一,竞技场得分达到 1357 分,还略超 OpenAI o1 的 1352 分。