·DeepSeek同时考虑算法精度和系统效率。除了极致的底层优化,协同优化也可能让大模型在利用国产算力时达到甚至超越英伟达GPU的性能。从最顶层的产品应用到底层的基础设施,大模型的每一个层级都已经形成了非常好的生态,每一个层级上都存在着优化空间。
DeepSeek是国产算力企业在春节看到的最大烟花。2025年春节前,DeepSeek发布大模型;春节期间,国内GPU企业以及云计算厂商等,纷纷披露适配DeepSeek模型的进展。为此,不少科技从业人员度过了一个无休的假期。
近日来,人工智能大模型DeepSeek热度不减。自ChatGPT引发新一波人工智能热潮以来,大模型产业发展对算力的依赖与日俱增。科技公司不惜投入高额算力用于模型训练,各地智算中心纷纷加速建设,高性能芯片供不应求。全球人工智能产业一度形成了“堆算力”的路径依赖。
SemiAnalysis新出的一篇分析报告,对于DeepSeek的分析,包括中国在成本、真实训练成本、封闭模型利润率影响方面的领先地位 ——H100 价格飙升、补贴推理定价、出口管制、多头潜在注意力机制。
DeepSeek突飞猛进的发展,使其成为全球现象级大模型。作为低成本高性能的开源大模型,DeepSeek在科技界、AI界以及大模型界仍在不停地掀起更大的浪花。从科技、医药、传媒到非银金融、汽车、电信行业,DeepSeek的“朋友圈”仍在持续扩张中。
“春节至今,我们平台的流量增长了5倍,业务量增长了3倍。”开放传神公司创始人陈冉告诉解放日报·上观新闻记者。这家入驻上海“模速空间”大模型创新生态社区的企业运营OpenCSG平台,为大模型开发者打造开源社区。