每经记者:宋欣悦 每经编辑:高涵|2025年2月19日星期三|NO.1梁文锋带实习生发论文!DeepSeek降本新招来了2月18日,DeepSeek在海外社交平台发布了一篇纯技术论文报告,论文主要关于原生稀疏注意力(NSA)。
DeepSeek 发布的论文,标题名为:《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。
北京时间2月18日,在马斯克还在庆祝Grok 3模型正式发布的时候,DeepSeek官方在社交平台X上发布了一篇纯技术论文,主要是关于原生稀疏注意力,直指ChatGPT等顶尖大模型背后的Transformer架构最核心的注意力机制。
马斯克发布Grok3被OeepSeek新论文吊打?马斯克的AI产品终于来了,就在18号,马斯克的Grok3横空出世,号称"地球最聪明AI",还没发布就备受瞩目。而Grok3马斯克是主打一个大力出奇迹,那就是堆了20万张H100显卡,堪称是全球算力最强的大模型。