最近,DeepSeek 因为 R1 版本开源模型的发布,在外网刷屏了! 这家中国公司究竟是如何炼成的?36 氪旗下的「暗涌」团队两次采访了 DeepSeek 创始人梁文锋,揭开了这家技术理想主义公司的创新密码。### **1.
自 2023 年成立以来,DeepSeek 发展迅猛,其推出的一系列大模型在性能和性价比上都展现出了独特的优势,在多个领域取得了令人瞩目的成绩。在探讨 DeepSeek 对 AI 行业的影响之前,我们先来全面了解一下当前 AI 行业的整体状况。
完整训练成本仅 557.6 万美元,使用的 GPU 小时数为 278.8 万 ,与 Llama 3 高达 1 亿美元的训练成本,以及 GPT-4o 可能高达 10 亿美元的预算相比,DeepSeek V3 的成本优势简直一目了然,也难怪被大家称为 “国货之光”。