deep seek反击蒸馏

资讯

DeepSeek：“蒸馏”与“原创”的AI风暴
它成功突破了多个开源大模型的性能瓶颈，在众多测试中表现出色，甚至超越了阿里自研的 Qwen2.5-72B 和 Meta 的 Llama 3.1-405B 等知名模型，与 OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5-Sonnet 等闭源大模型相抗衡，展现出了强大的实力。
岳阳新浪潮
2评论
对 Deepseek 从赞叹到压制，硅谷为何一周内变脸
这一切源自 1 月 20 日 DeepSeek 发布的 R1 推理模型——它在多个逻辑任务上的表现与 OpenAI-o1 旗鼓相当，而其运行成本仅为 OpenAI 费用的约 2%。
极客公园
1评论
周鸿祎谈模型蒸馏：并非数据偷窃，DeepSeek 走出创新之路
周鸿祎称，这两天美国对DeepSeek 痛下杀手，政府制裁、起诉，Openai公司也指责其从自家 GPT 里蒸馏能力，甚至美国政府据说要宣布蒸馏为非法。但蒸馏是人工智能训练普遍方法，是把大模型能力总结出来加强小模型。
一叶障目
震惊！中国 DeepSeek 遭美国无理打压，背后真相令人深思
近日，中国人工智能领域的佼佼者 DeepSeek 遭遇了来自美国的一系列无端指责与恶意攻击，这一事件在国际科技舞台上掀起了惊涛骇浪。
执着的蛋糕NsKVFqw
2评论
美国StabilityAI 创始人强势发声，DeepSeek 没有抄袭
2020 年，他创立了 StabilityAI，致力于推动开源 AI 技术的发展，旗下的 Stable Diffusion 更是在生成式 AI 领域掀起了一场革命。
人工智能学家
231评论
从DeepSeek适配潮看中国芯突围：大模型时代的生态反击！
开年以来，国产AI大模型DeepSeek以出色的性价比和高效的模型技术，迅速成为全球AI关注的焦点。这一热潮不仅引发了国际科技巨头的关注，更带动了国产芯片厂商的集体行动。
与非网
一文看懂DeepSeek的中国式创新
文 | SE7EN_CHLOE随着春节前后数个大模型陆续发布，人工智能的网络热评已经从技术圈扩大到社会圈、朋友圈。国内外好评与差评，热捧与诋毁，在我看来都是浮云，它既不会影响DeepSeek自身的迭代，也不会掣肘同行探索脚步。
钛媒体APP
78评论

视频