deepseek如何蒸馏自己的模型

资讯

刷屏的DeepSeek-V3能力到底如何？国外评测报告：超越迄今为止所有开源模型！自称ChatGPT，真相或指向“AI污染”
每经记者：郑雨航每经编辑：高涵,兰素英“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
每日经济新闻
234评论
“夜袭”OpenAI！DeepSeek开源最强推理模型R1，再震欧美同行
能力相当于一个月 200 美元的 ChatGPT o1 版本，却完全免费。2025 年 1 月 15 日，DeepSeek 推出移动端 AI 助手「DeepSeek」App。
金融界
226评论
成本是GPT的1/20，轰动硅谷的中国大模型DeepSeek是怎么做到的？
“善攻者，敌不知其所守;善守者，敌不知其所攻。这基本就是美国和中国了。”站在汇金国际大厦，透过巨大的落地窗，京杭大运河一览无余。
吴晓波频道
53评论
DeepSeek最新模型硬刚o1！业界大佬：这才配叫OpenAI
每经记者：岳楚鹏每经编辑：兰素英OpenAI怎么也没想到，o3还在画饼阶段，中国一夜之间就冒出来两个能和o1打对台的模型。1月20日，月之暗面正式推出多模态思考模型Kimi k1.5，并首次公开该模型的训练技术报告。其中，Kimi k1.
每日经济新闻
1评论
揭秘DeepSeek-V3“物美价廉”的背后：蒸馏技术存在天花板，依赖合成数据训练有风险
每经记者：郑雨航每经实习记者：岳楚鹏每经编辑：兰素英最近大火的深度求索DeepSeek-V3模型仅用557万美元的训练费用，就达到了顶尖模型的效果，而且产品价格低廉，因此被网友们戏称为大模型界的“拼多多”。
每日经济新闻
97评论
震惊 AI 界！DeepSeek-R1 ：纯RL打造推理王者，AI 自主学习里程碑「技术报告解读」
惊人的性能提升: DeepSeek-R1-Zero 在 AIME 2024 基准测试上，pass@1 分数从 15.6% 提升到了 71.0%，通过多数投票更是达到了 86.7%，与 OpenAI-01-0912 的表现相当甚至更好。
人工智能学家
28评论

视频