deepseek 蒸馏微调

资讯

MacMini M4 微调训练 DeepSeek-R1 蒸馏模型
正好国补的MacMini M4已经到货，折腾了几天后基本环境都已经ready，顺便在DeepSeek模型下尝试下微调和训练。
非愉日志
15评论
一步步将DeepSeek R1微调成一个DeepDoctor（资深医生）
DeepSeek 颠覆了 AI 领域，挑战 OpenAI 的主导地位，推出了一系列先进的推理模型。该精简版 DeepSeek-R1 模型是通过在 DeepSeek-R1 生成的数据上微调 Llama 3.1 8B 模型而创建的。
柯林斯聊ai科技
1评论
新华三发布DeepSeek一体机，搭载DeepSeek V3、R1模型
来源：环球网【环球网科技综合报道】2月11日消息，紫光股份旗下新华三集团发布基于DeepSeek大模型的一体机UniCube，全面搭载DeepSeek V3、R1模型，并实现671B DeepSeek大模型单机推理及单机训推一体服务。
环球网
290评论

视频

在线举报