deepdeek蒸馏版

资讯

DeepSeek的“蒸馏模型”超越原创？美国要对“蒸馏技术”下手
中国人工智能初创公司DeepSeek在过去一周成为硅谷热议的对象，并触发了本周一美国科技股“崩盘”。1月29日，OpenAI最新称，它发现有证据表明中国人工智能初创公司DeepSeek使用其专有模型来训练自己的开源模型，并暗示这可能违反了OpenAI的服务条款。
第一财经
623评论
大白话说清楚DeepSeek的蒸馏技术到底是什么？
这个概念最早出现在2015年《Distilling the Knowledge in a Neural Network》论文里，作者是 Geoffrey Hinton、Oriol Vinyals 和 Jeff Dean。
了不起的云计算
3评论
DeepSeek：“蒸馏”与“原创”的AI风暴
它成功突破了多个开源大模型的性能瓶颈，在众多测试中表现出色，甚至超越了阿里自研的 Qwen2.5-72B 和 Meta 的 Llama 3.1-405B 等知名模型，与 OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5-Sonnet 等闭源大模型相抗衡，展现出了强大的实力。
岳阳新浪潮
2评论
DeepSeek是如何通过“蒸馏”技术打造自己的AI模型
1 引言:最近，外媒对中国公司——DeepSeek进行了猛烈抨击，指控其采用了所谓的“蒸馏”技术，涉嫌抄袭甚至作弊。
拉菲朱
2评论
优惠结束，DeepSeek涨价！
2月9日，DeepSeek-V3 API服务的45天优惠价格体验期已结束，从2月9日开始将调整为新的价格：每百万输入tokens 0.5元（缓存命中）/2元（缓存未命中），每百万输出tokens 8元。此前DeepSeek在优惠期内API价格为每百万输入tokens 0.
每日经济新闻
63评论
DeepSeek引爆AI，国产GPU集体撑腰
文 | 半导体产业纵横近日，想必诸多用户都怀揣着这样的疑惑：我的手机为何频频推送关于DeepSeek的资讯？这 DeepSeek 究竟是什么？它又为何能在问世之际，就引发如此热烈的关注与轰动？
钛媒体APP
20评论
IBM在watsonx.ai上线DeepSeek R1 蒸馏模型
IBM宣布，DeepSeek-R1 的 Llama 3.1 8B 和 Llama 3.3 70b 蒸馏版本现已在 IBM 的企业级 AI 开发平台 watsonx.ai上提供。
界面快讯
钉钉接入DeepSeek：无需配置可一键创建AI 助理
来源：环球网【环球网科技综合报道】2月7日，钉钉 AI 助理现已全面接入 DeepSeek 系列模型，用户可自主选择 DeepSeek 系列的 R1（671B 满血版及 qwen32b 蒸馏版）、V3（671B 满血版）共 3 种模型。
环球网
1评论
爆肝整理：超100款DeepSeek应用清单【收藏】
仅是DeepSeek官方整理的“DeepSeek实用集成”名单，就有54款接入DeepSeek的应用，包括24个应用程序、3个AI Agent框架、1个RAG框架、1个Solana框架、3个即时通讯插件、8个浏览器插件、2个VS Code插件、3个neovim插件、2个JetBrains插件等。
智东西
43评论
为了让DeepSeek-R1用起来更顺畅，火山引擎将TPM上调到了500万！
放眼海外， OpenAI 为用户设置的 TPM 也非常低:免费用户仅有 4 万 TPM，而只有当付费等级达到 Tier 3 以上时，才有可能获得与火山引擎提供的相当的 TPM。
机器之心Pro
25评论

视频