北京时间2月18日,在马斯克还在庆祝Grok 3模型正式发布的时候,DeepSeek官方在社交平台X上发布了一篇纯技术论文,主要是关于原生稀疏注意力,直指ChatGPT等顶尖大模型背后的Transformer架构最核心的注意力机制。
生成式AI正以惊人的速度进化出“一本正经胡说八道”的能力——不久前,两封信网上流传,一封署名英伟达CEO黄仁勋的内部信表达对DeepSeek的看法,一封是“来自”DeepSeek CEO 梁文锋对冯骥的公开回应。