火山deepseek训练自己的模型

资讯

DeepSeek 671B用不起？不妨从0开始，训练出自己的0.02B小模型
学习研究大模型的最佳实践就是要亲身体验和不断的折腾，我本地环境MacMini M4（24G）跑DeepSeek-R1的8B模型很轻松，14B也基本勉强，再往上就没戏了，更别说满血版的671B。不过既然想学习模型的训练，可以根据自己的实际硬件情况，不妨先从小模型开始。
非愉日志
火山引擎总裁：大家应像DeepSeek聚焦基本功，少无端猜测归因外部
字节跳动隔空回应了百度在大模型价格战上的喊话。2月13日，字节跳动旗下火山引擎总裁谭待通过朋友圈回应：大模型降价是通过技术创新实现的，大家应像DeepSeek一样聚焦基本功，少做无端猜测。谭待表示，豆包1.
澎湃新闻
教你使用目前最稳定的DeepSeek接口（火山方舟）
这几天连续使用了多个平台的满血版的DeepSeek R1接口，总结起来，只有火山方舟版是最稳定，基本不会太卡壳，而且能够显示推理过程。
AI秀明哥
5评论
DeepSeeK本地部署 + 玄学训练，普通人也能上手！一文打通所有步骤
如果某一天，该公司不给用了，你训练的数据，也就不能用了，另外，训练出来的结果是共享的，所有人都能访问，说通俗一点，你的训练就是帮AI公司的忙——“给人做嫁衣”。
云可赠人fly
年薪百万！DeepSeek“招兵买马”！OpenAI奥特曼：没有计划起诉DeepSeek！阿里、百度、腾讯集体官宣接入
春节假期接近尾声，这个假期DeepSeek无疑是最火爆的话题之一。在DeepSeek旗下大模型DeepSeek-R1“爆火”后，多个云平台宣布上线DeepSeek旗下模型。另外，近日OpenAI CEO奥尔特曼表示，该公司没有计划起诉DeepSeek。
每日经济新闻
8评论

视频