完整训练成本仅 557.6 万美元,使用的 GPU 小时数为 278.8 万 ,与 Llama 3 高达 1 亿美元的训练成本,以及 GPT-4o 可能高达 10 亿美元的预算相比,DeepSeek V3 的成本优势简直一目了然,也难怪被大家称为 “国货之光”。