其发布的模型拥有庞大的参数规模,如 DeepSeek-V3 模型参数规模达 6710 亿 ,但实际运行时仅激活 370 亿参数,这种动态选择 “专家网络” 处理任务的模式,既降低了算力需求,又提升了效率。
一、技术革命的触发逻辑高度相似颠覆性产品的定义能力正如2010年iPhone4通过多点触控屏、视网膜显示和iOS系统重新定义了智能手机,DeepSeek通过其创新的模型架构(如细粒度专家划分的MoE设计)和高效训练范式(仅用40%计算量达到主流模型性能),重新定义了AI模型的工程