这一突破性成果的核心在于算法密度取代算力堆叠:通过混合专家架构动态激活参数、8位浮点训练优化,以及滑动窗口多头潜在注意力技术,DeepSeek在长文本处理中显存需求降低至GPT-4的1/5,推理速度却提升3倍。
近两天一段实车视频演示备受关注,一辆广汽智能车上的车机借助DeepSeek-R1大模型回答语音提问,预示广汽自主研发的ADiGO SENSE端云一体大模型与DeepSeek-R1大模型完成深度融合。几乎同时,工信部宣布,三家基础电信企业均全面接入DeepSeek开源大模型。
一、从无名到现象级:DeepSeek的“泼天富贵”从何而来?2025年1月20日,DeepSeek-R1发布后,这款国产AI大模型以“中国速度”席卷全球:短短一个月,日活跃用户(DAU)从34.7万飙升至1.19亿,超越豆包、文心一言等国内竞品,直逼ChatGPT的全球霸主地位。