凌晨3点,硅谷AI实验室突然传出惊呼——马斯克在社交平台连发3个“❗”,转发了一条来自中国的技术论文。这篇由深度求索(DeepSeek)团队发布的成果显示,其新一代大模型训练速度达到行业均值3.2倍,能耗直降40%,甚至突破冯·诺依曼架构的经典算力瓶颈。
每经记者:岳楚鹏 每经编辑:兰素英1月20日发布的DeepSeek-R1模型让开发公司DeepSeek在全球的热度持续攀升。1月27日,DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜,甚至超越了大众熟知的ChatGPT。
当地时间2月6日法国人工智能初创公司Mistral AI宣布对旗下旗舰产品Le Chat进行了全面升级正式上线移动端(支持iOS和Android)后续也会向企业私有基础设施开放而这次升级Le Chat主打的就是一个“快”Le Chat官网截图,可选择Canvas功能Le Chat
当谷歌还在优化Transformer时,DeepSeek的工程师给AI装上了『量子速读』能力——同样的训练成本,模型推理速度提升17倍!连马斯克都在推特感叹:“这算法应该用在星链计划”。今天我们用点外卖的故事,揭开这个改变AI游戏规则的技术秘密。