完整训练成本仅 557.6 万美元,使用的 GPU 小时数为 278.8 万 ,与 Llama 3 高达 1 亿美元的训练成本,以及 GPT-4o 可能高达 10 亿美元的预算相比,DeepSeek V3 的成本优势简直一目了然,也难怪被大家称为 “国货之光”。
在科技创新的时代浪潮中,一位来自广东湛江的年轻人 —— 梁文锋,以其卓越的成就吸引了众人的目光。中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,梁文锋作为国产大模型企业深度求索创始人,受邀出席并发言,这一消息瞬间刷屏科技圈。