deepceek大模型

资讯

“AI界的拼多多”DeepSeek推出新款大模型，水平如何？
在中文能力上，V3 与 Qwen2.5-72B 在教育类测评 C-Eval 和代词消歧等评测集上表现相近，但在事实知识 C-SimpleQA 上更为领先。
观察者网
44评论
中信证券：DeepSeek V3发布，AI大模型应用将逐步走向普惠
【大河财立方消息】12月30日，中信证券计算机行业首席分析师杨泽原在研报中指出，近日，DeepSeek-V3的正式发版引起AI业内广泛高度关注，其在保证了模型能力的前提下，训练效率和推理速度大幅提升。
大河财立方
1评论
“大模型性价比之王”刷屏 DeepSeek打破算力需求“怪圈”？
本报记者吴清北京报道近日，一家来自中国的公司Deepseek在全球AI界刷屏，其最新推出的大模型DeepSeek-V3，迅速在AI行业内引发广泛关注和热议，主要原因就是预训练成本之低，其训练同样性能的大模型成本仅是行业主流的十分之一左右。
中国经营报
1评论
大厂环伺、DeepSeek崛起大模型“六小虎”走向分化|2025年展望
《科创板日报》1月1日讯（记者李明明）临近2024年年末，大模型领域掀起新一轮融资热潮。12月23日，阶跃星辰宣布完成数亿美元B轮融资；12月17日，智谱获得新一轮30亿元融资。
财联社
4评论
国产大模型DeepSeek-V3一夜火爆全球，《DeepSeek-V3技术报告》，53页pdf
来源：转载机器之心报道机器之心编辑部今天，一个国产大模型火遍了世界。打开 X，满眼都是讨论 DeepSeek-V3 的推文，而其中最热门的话题之一是这个参数量高达 671B 的大型语言模型的预训练过程竟然只用了 266.
人工智能学家
55评论
详解DeepSeek-V3：大模型训练加速神器，MoE焕发新生丨智源深度
我国科技企业在过去的几年里，始终坚持着开发出能够解决更为复杂问题并处理更大数据量的模型的目标，而这一切并不需要依赖过多的计算能力。
人工智能学家
3评论
国产AI大模型DeepSeek冲破封锁全球刷屏，成本仅为GPT的1/20
来源：【爱济南新闻客户端】近日，量化巨头幻方量化的子公司深度求索（DeepSeek）发布了全新系列模型DeepSeek-V3，并同步开源。这一事件迅速引爆AI圈，DeepSeek-V3不仅霸榜开源模型，更在性能上与全球顶尖闭源模型GPT-4o和Claude-3.
全国党媒信息公共平台
7评论
国产AI大模型DeepSeek-V3比肩GPT-4o,刷屏全球AI界
就在2024年12月26日，国产大模型DeepSeek V3的发布在国际AI圈投下一个重磅深水炸弹，引入瞩目。为什么会得到这么大的刷屏关注度，一起来看这个国产AI大模型DeepSeek的厉害之处，在一众国内外的AI中到底亮眼之处在哪里。
大白话
国产大模型DeepSeek-V3发布，直逼ChatGPT o1，起底核心团队。
朱琪豪:北大计算机学院 2024 届博士，在校期间就发表了 16 篇 CCF-A 类论文，两次获得 ACM SIGSOFT 杰出论文奖，主导开发了 DeepSeek-Coder-V1。
字符无限科技
1评论
成本是GPT的1/20，轰动硅谷的中国大模型DeepSeek是怎么做到的？
“善攻者，敌不知其所守;善守者，敌不知其所攻。这基本就是美国和中国了。”站在汇金国际大厦，透过巨大的落地窗，京杭大运河一览无余。
吴晓波频道
53评论

视频