学习研究大模型的最佳实践就是要亲身体验和不断的折腾,我本地环境MacMini M4(24G)跑DeepSeek-R1的8B模型很轻松,14B也基本勉强,再往上就没戏了,更别说满血版的671B。不过既然想学习模型的训练,可以根据自己的实际硬件情况,不妨先从小模型开始。
石门中学日前在佛山发布“石门星辰”,成为国内首个本地化完整部署DeepSeek 671B的中学。所谓“石门星辰”,硬件核心是完整版DeepSeek 671B系统采用本地服务器架构,在确保数据安全与低时延的基础上,构建一个覆盖教学全场景的智能服务体系。