中国人工智能初创公司DeepSeek在过去一周成为硅谷热议的对象,并触发了本周一美国科技股“崩盘”。1月29日,OpenAI最新称,它发现有证据表明中国人工智能初创公司DeepSeek使用其专有模型来训练自己的开源模型,并暗示这可能违反了OpenAI的服务条款。
这个概念最早出现在2015年《Distilling the Knowledge in a Neural Network》论文里,作者是 Geoffrey Hinton、Oriol Vinyals 和 Jeff Dean。
来源:环球网 【环球网科技综合报道】2月11日消息,紫光股份旗下新华三集团发布基于DeepSeek大模型的一体机UniCube,全面搭载DeepSeek V3、R1模型,并实现671B DeepSeek大模型单机推理及单机训推一体服务。
近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。