deep sick蒸馏版是什么

资讯

DeepSeek是如何通过“蒸馏”技术打造自己的AI模型
1 引言:最近，外媒对中国公司——DeepSeek进行了猛烈抨击，指控其采用了所谓的“蒸馏”技术，涉嫌抄袭甚至作弊。
拉菲朱
2评论
大白话说清楚DeepSeek的蒸馏技术到底是什么？
这个概念最早出现在2015年《Distilling the Knowledge in a Neural Network》论文里，作者是 Geoffrey Hinton、Oriol Vinyals 和 Jeff Dean。
了不起的云计算
3评论
什么是蒸馏？DeepSeek如何蒸馏？
那好，为什么人家能蒸馏出好东西，你却啥都蒸馏不出来呢。为什么在DeepSeek之前，你从来没有听说过?
科学火箭叔
173评论
DeepSeek的“蒸馏模型”超越原创？美国要对“蒸馏技术”下手
中国人工智能初创公司DeepSeek在过去一周成为硅谷热议的对象，并触发了本周一美国科技股“崩盘”。1月29日，OpenAI最新称，它发现有证据表明中国人工智能初创公司DeepSeek使用其专有模型来训练自己的开源模型，并暗示这可能违反了OpenAI的服务条款。
第一财经
622评论
DeepSeek：“蒸馏”与“原创”的AI风暴
它成功突破了多个开源大模型的性能瓶颈，在众多测试中表现出色，甚至超越了阿里自研的 Qwen2.5-72B 和 Meta 的 Llama 3.1-405B 等知名模型，与 OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5-Sonnet 等闭源大模型相抗衡，展现出了强大的实力。
岳阳新浪潮
2评论
别再被 DeepSeek R1 本地部署割韭菜，我帮你把坑都踩遍了 | 附免费教程
买它！趁着过年有空学起来。这个春节，DeepSeek 像一条鲶鱼搅动了海内外无数人的心弦。当硅谷还沉浸 DeepSeek 带来的震撼时，一场声势浩大的 AI「淘金热」也在逐渐渗透国内主流电商平台。
爱范儿
21评论
支付宝百宝箱接入 DeepSeek！人人都能用满血 R1 构建智能体了
习惯了在 DeepSeek 的各个「渠道服」里打游击的我们，现在又多了一个选择——支付宝「百宝箱」智能体开发平台。
爱范儿
21评论
不得了！新学期，多所高校上线“满血版”DeepSeek
首都教育寒假期间DeepSeek（深度求索）火爆全球作为国产AI大模型的代表它在自然语言处理、知识问答内容生成等方面展现出良好性能新学期中国人民大学、北京交通大学、浙江大学上海交通大学、华东师范大学等多所高校发布消息开展DeepSeek的实践应用不少高校甚至本地化部署了“满血版
新重庆-重庆日报
新学期伊始，三所知名高校同日官宣：接入DeepSeek“满血版”
连日来，DeepSeek热度不减。就在昨天（2月17日），上海交通大学、华东师范大学、浙江大学等知名高校在开学首日官宣：接入DeepSeek“满血版”。什么是DeepSeek“满血版”？高校接入DeepSeek，将会碰撞出怎样的火花？
上观新闻
11评论
优惠结束，DeepSeek涨价！
2月9日，DeepSeek-V3 API服务的45天优惠价格体验期已结束，从2月9日开始将调整为新的价格：每百万输入tokens 0.5元（缓存命中）/2元（缓存未命中），每百万输出tokens 8元。此前DeepSeek在优惠期内API价格为每百万输入tokens 0.
每日经济新闻
63评论
一键部署+限免体验！盘点如何在华为云上体验DeepSeek
本文分享自华为云社区《一键部署+限免体验!当前平台已支持昇腾适配版的DeepSeek-R1/V3体验，并且提供 200 万 token 支持开发者免费使用，帮助开发者快速验证和实现创新应用，开发者可以在MaaS平台上轻松部署和使用这一模型。
华为云开发者联盟
1评论
为了让DeepSeek-R1用起来更顺畅，火山引擎将TPM上调到了500万！
放眼海外， OpenAI 为用户设置的 TPM 也非常低:免费用户仅有 4 万 TPM，而只有当付费等级达到 Tier 3 以上时，才有可能获得与火山引擎提供的相当的 TPM。
机器之心Pro
26评论

加载更多

视频

问答

什么是壶式蒸馏威士忌？
威士忌小白，想了解
头条问答