原标题: 响应“东数西算”战略:亿算智能推动首个国产万卡推理集群支持DeepSeek 671B全量部署,构建国产算力与大模型融合新生态 DeepSeek作为国产大模型领域的破局者,凭借其独创的「动态稀疏训练架构」与「多模态梯度协同算法」,在保证推理精度的同时,将训练能耗降低至
AI新秀DeepSeek以“中国速度”席卷全网,成为现象级APP。2月8日,QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。
SemiAnalysis新出的一篇分析报告,对于DeepSeek的分析,包括中国在成本、真实训练成本、封闭模型利润率影响方面的领先地位 ——H100 价格飙升、补贴推理定价、出口管制、多头潜在注意力机制。
·DeepSeek同时考虑算法精度和系统效率。除了极致的底层优化,协同优化也可能让大模型在利用国产算力时达到甚至超越英伟达GPU的性能。从最顶层的产品应用到底层的基础设施,大模型的每一个层级都已经形成了非常好的生态,每一个层级上都存在着优化空间。
DeepSeek突飞猛进的发展,使其成为全球现象级大模型。作为低成本高性能的开源大模型,DeepSeek在科技界、AI界以及大模型界仍在不停地掀起更大的浪花。从科技、医药、传媒到非银金融、汽车、电信行业,DeepSeek的“朋友圈”仍在持续扩张中。
以DeepSeek-R1和V3为代表的开源模型系列在多语言理解和复杂推理任务中表现出色,极大优化了算力成本,并进一步改变了训练和部署的算法结构,这一技术创新将快速提升对于推理算力的需求,从而加速推动AI应用场景的落地。
2024年12月,国产大模型DeepSeek推出DeepSeek-V3,以极低训练成本实现媲GPT-4o和Claude Sonnet 3.5的性能,震惊业界。2025年1月20日,DeepSeek发布DeepSeek-R1,同步开源模型权重。
来源:【厦门日报】美图公司展厅内展示的部分生成式AI应用。(本报记者 黄少毅 摄)国产AI大模型DeepSeek(深度求索)凭借出色的性价比,在春节期间火出圈,将中国人工智能产业推向全球科技界的聚光灯下。连日来,多家厦门科技企业接入DeepSeek,推动应用创新。