大模型deepseek

资讯

国产AI大模型DeepSeek-V3比肩GPT-4o,刷屏全球AI界
就在2024年12月26日，国产大模型DeepSeek V3的发布在国际AI圈投下一个重磅深水炸弹，引入瞩目。为什么会得到这么大的刷屏关注度，一起来看这个国产AI大模型DeepSeek的厉害之处，在一众国内外的AI中到底亮眼之处在哪里。
大白话
成本是GPT的1/20，轰动硅谷的中国大模型DeepSeek是怎么做到的？
“善攻者，敌不知其所守;善守者，敌不知其所攻。这基本就是美国和中国了。”站在汇金国际大厦，透过巨大的落地窗，京杭大运河一览无余。
吴晓波频道
52评论
“大模型性价比之王”刷屏 DeepSeek打破算力需求“怪圈”？
本报记者吴清北京报道近日，一家来自中国的公司Deepseek在全球AI界刷屏，其最新推出的大模型DeepSeek-V3，迅速在AI行业内引发广泛关注和热议，主要原因就是预训练成本之低，其训练同样性能的大模型成本仅是行业主流的十分之一左右。
中国经营报
中信证券：DeepSeek V3发布，AI大模型应用将逐步走向普惠
【大河财立方消息】12月30日，中信证券计算机行业首席分析师杨泽原在研报中指出，近日，DeepSeek-V3的正式发版引起AI业内广泛高度关注，其在保证了模型能力的前提下，训练效率和推理速度大幅提升。
大河财立方
1评论
大模型的2024，这可能是最早的一篇年度总结文！
从某种意义上说，2024年不仅是技术突破的一年，更是行业走向成熟的重要转折点。顶级大模型的训练成本大幅降低:DeepSeek v3仅需557万美元训练成本，便可达到与Claude 3.5 Sonnet等模型比肩的性能。
华尔街见闻
6评论
大厂环伺、DeepSeek崛起大模型“六小虎”走向分化|2025年展望
《科创板日报》1月1日讯（记者李明明）临近2024年年末，大模型领域掀起新一轮融资热潮。12月23日，阶跃星辰宣布完成数亿美元B轮融资；12月17日，智谱获得新一轮30亿元融资。
财联社
4评论
“AI界的拼多多”DeepSeek发布新模型
12月26日晚间，杭州深度求索人工智能基础技术研究有限公司（以下简称“深度求索”）宣布，全新系列模型DeepSeek-V3首个版本上线并同步开源。
湖南日报
13评论
DeepSeek预示算力需求“打骨折”？业界：别只盯着训练 AI行业进入推理时代
《科创板日报》12月30日讯日前，深度求索DeepSeek-V3横空出世，在AI行业内引发巨震，关键原因之一就是预训练成本之低——这个参数量高达671B的大模型，在预训练阶段仅使用2048块GPU训练了2个月，且只花费557.6万美元。
财联社
19评论
为什么说DeepSeek是2025年的Kimi
而一个更重要的问题是，这是中国公司在受到制裁，算力有限，不能购买足够数量显卡的基础上，使用小数据集蒸馏等方法，而得到的一个更节省成本的模型。
钛媒体APP
30评论

视频