deepsek蒸馏了其他的大模型吗

资讯

DeepSeek是如何通过“蒸馏”技术打造自己的AI模型
1 引言:最近，外媒对中国公司——DeepSeek进行了猛烈抨击，指控其采用了所谓的“蒸馏”技术，涉嫌抄袭甚至作弊。
拉菲朱
3评论
DeepSeek的“蒸馏模型”超越原创？美国要对“蒸馏技术”下手
中国人工智能初创公司DeepSeek在过去一周成为硅谷热议的对象，并触发了本周一美国科技股“崩盘”。1月29日，OpenAI最新称，它发现有证据表明中国人工智能初创公司DeepSeek使用其专有模型来训练自己的开源模型，并暗示这可能违反了OpenAI的服务条款。
第一财经
568评论
大白话说清楚DeepSeek的蒸馏技术到底是什么？
这个概念最早出现在2015年《Distilling the Knowledge in a Neural Network》论文里，作者是 Geoffrey Hinton、Oriol Vinyals 和 Jeff Dean。
了不起的云计算
6评论
火遍全球的DeepSeek：科学家是怎么用它的？
原文作者：Elizabeth Gibney科研人员正在测试这个开源模型执行科研任务的能力——从数学一直到认知科学。DeepSeek的模型能在一个对话机器人app上使用。
上观新闻
122评论
新华三发布DeepSeek一体机，搭载DeepSeek V3、R1模型
来源：环球网【环球网科技综合报道】2月11日消息，紫光股份旗下新华三集团发布基于DeepSeek大模型的一体机UniCube，全面搭载DeepSeek V3、R1模型，并实现671B DeepSeek大模型单机推理及单机训推一体服务。
环球网
290评论
权威榜单发布，全球开源大模型前十均为阿里通义千问衍生模型
近日，全球最大AI开源社区Huggingface发布了最新的开源大模型榜单（Open LLM Leaderboard），榜单显示，其排名前十的开源大模型是基于阿里通义千问（Qwen）开源模型二次训练的衍生模型。
封面新闻
14评论

视频

在线举报