deepseek没有gpu怎么训练

资讯

打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域全复盘
刚刚过去的 2024 年是生成式 AI 大发展的一年，我们见证了 OpenAI Sora 的崛起，大模型服务价格的飞速下降，以及国内开源大模型的奋起直追。
机器之心Pro
4评论
省钱也是技术活：解密DeepSeek的极致压榨术
当o1、Claude、Gemini和Llama 3等模型还在为数亿美元的训练成本苦恼时，DeepSeek-V3用557.6万美元的预算，在2048个H800 GPU集群上仅花费3.7天/万亿tokens的训练时间，就达到了足以与它们比肩的性能。
人工智能学家
26评论

视频

加载更多

问答

没有GPU的我们如何利用亚马逊GPU服务器训练深度学习？
头条问答