完整训练成本仅 557.6 万美元,使用的 GPU 小时数为 278.8 万 ,与 Llama 3 高达 1 亿美元的训练成本,以及 GPT-4o 可能高达 10 亿美元的预算相比,DeepSeek V3 的成本优势简直一目了然,也难怪被大家称为 “国货之光”。
在 Amodei 发表了那篇呼吁加强对华算力管制的奇文之后,支持特朗普的风险投资机构 Andreessen Horowitz 创始人Marc Andreessen 就出来打脸了:“闭源、不透明、吹毛求疵,寻求政治垄断与开源和免费的对决,可不是美国需要的赢的方式”。