DeepSeek作为国产大模型领域的破局者,凭借其独创的「动态稀疏训练架构」与「多模态梯度协同算法」,在保证推理精度的同时,将训练能耗降低至同类模型的十分之一,首次验证了千亿级大模型低成本商业化的可行性。
DeepSeek是国产算力企业在春节看到的最大烟花。2025年春节前,DeepSeek发布大模型;春节期间,国内GPU企业以及云计算厂商等,纷纷披露适配DeepSeek模型的进展。为此,不少科技从业人员度过了一个无休的假期。