每经记者:宋欣悦 每经编辑:高涵|2025年2月19日星期三|NO.1梁文锋带实习生发论文!DeepSeek降本新招来了2月18日,DeepSeek在海外社交平台发布了一篇纯技术论文报告,论文主要关于原生稀疏注意力(NSA)。
梁文锋是横空出世的青年才俊,他创建的深度求索公司在极短的时间内推出DeepSeek-V3/R1两种大模型,以其性能卓越、开源普惠的特点很快便风行世界,将中国AGI推向世界顶端,有力地推动了技术发展和文明进程。
来论 春节期间,中国国产大模型DeepSeek持续引发热议,意外地成为假期最热门的科技话题。 1月20日,中国大模型公司深度求索正式发布推理大模型DeepSeek-R1,一经推出就震撼了业界。1月27日,DeepSeek应用登顶苹果中国区和美国区应用商店免费App下载排行榜。
一家人工智能初创企业浅浅扇动两下翅膀,即掀起全球科技界的一阵“海啸”。短短30天,中国初创企业深度求索(DeepSeek)先后发布两款性能比肩GPT-4o的大模型,“1/18的训练成本、1/10的团队规模、不分伯仲的模型性能”令硅谷大受震撼。