完整训练成本仅 557.6 万美元,使用的 GPU 小时数为 278.8 万 ,与 Llama 3 高达 1 亿美元的训练成本,以及 GPT-4o 可能高达 10 亿美元的预算相比,DeepSeek V3 的成本优势简直一目了然,也难怪被大家称为 “国货之光”。
当地时间 1 月 27 日,纳斯达克股指出现 3% 下跌,原因是中国人工智能公司 DeepSeek 模型引发美国投资者关注。央视记者在纳斯达克交易所现场对纳斯达克副主席麦柯奕进行了采访。麦柯奕表示,他认为,DeepSeek 将是人工智能领域革命的重要组成部分。冲击美股!