deepsewk博士论文

资讯

DeepSeek新论文再次引发热议，它最重要的创新是什么？
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪DeepSeek V3和R1两款模型带来的热度尚未平息，一篇新论文再次引来科技圈对其创新性的集体评估。
界面新闻
11评论
DeepSeek发布最新技术论文，梁文锋是共创之一
2月18日，DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告，论文主要内容是关于NSA（Natively Sparse Attention，原生稀疏注意力），官方介绍这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。
第一财经
30评论
DeepSeek究竟创新了什么？
人工智能正处于创新爆发期，唯有持续创新，才能留在舞台中心。DeepSeek彻底走开源路线，它的大模型既性能优异，训练成本和使用成本又都超低，让人工智能从业者燃起了“我也能行”的希望，让各行各业燃起了“赶紧把人工智能用起来吧”的热情。
财经杂志
96评论
梁文锋、杨植麟论文“撞车”，直指算法优化，挑战ChatGPT核心机制！风投公司RAI Digital联合创始人：AI无需读完整本书，将更快、更高效
北京时间2月18日，在马斯克还在庆祝Grok 3模型正式发布的时候，DeepSeek官方在社交平台X上发布了一篇纯技术论文，主要是关于原生稀疏注意力，直指ChatGPT等顶尖大模型背后的Transformer架构最核心的注意力机制。
每日经济新闻
131评论

视频