大模型梁文锋

资讯

“梁文锋、杨植麟同一天发论文，关注大模型的未来趋势“
更有趣的是，两家公司的技术派明星创始人都亲自参与了研究，他们的名字分别出现在各自的论文和技术报告中，此举引发了外界的强烈关注。
人工智能学家
4评论
梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么
2月18日，在大洋彼岸的马斯克秀出最新大模型Grok 3当天，国产AI公司深度求索（DeepSeek）最新一篇论文引发关注，创始人梁文锋在署名之列，并2月16日提交到预印本平台arxiv。
澎湃新闻
3评论
“DeepSeek创始人梁文锋是一个有AI信仰的人”
“DeepSeek没有推广预算，也没有千万年薪挖人，就是目标明确地投入研究、发布产品。”上述投资人评论。另一家大模型独角兽向记者透露，“DeepSeek创始人梁文锋是一个有AI信仰的人，他坚持的技术浪漫主义，在业内非常知名。
澎湃新闻
这60条思考，读懂DeepSeek创始人梁文锋的与众不同
在整个2025年春节期间，DeepSeek的热度都一直不减。这再次证明了，在真正的产品力面前，营销力不值一提。
新浪财经
1评论
决战AI之巅：马斯克硬刚奥特曼梁文锋PK杨植麟｜产业科技周报
2月18日，马斯克硬刚奥特曼，梁文锋PK杨植麟，大模型领域最顶尖的精英们同天在模型层放大招，决战AI之巅——“城头变幻大王旗”，谁也无法稳坐高台。
亿邦动力
既生杨植麟，何生梁文锋
梁文峰与杨植麟，DeepSeek与月之暗面，颇有些当代版“既生瑜，何生亮”的意思。需要提醒大家，即便如今所有的镁光灯都聚焦在DeepSeek-R1上，但光环之外仍有人在努力，简单地归因和粗暴地判断于当下而言都是极其傲慢的。
智及
马斯克向左梁文锋向右
而同一天，DeepSeek的梁文锋和Kimi的杨植麟分别在专业网站上发布了自己参与的论文，这两篇论文均与如何减少长文本计算量，加快训练效率有关。
新京报
140评论
梁文锋、杨植麟论文“撞车”，直指算法优化，挑战ChatGPT核心机制！风投公司RAI Digital联合创始人：AI无需读完整本书，将更快、更高效
北京时间2月18日，在马斯克还在庆祝Grok 3模型正式发布的时候，DeepSeek官方在社交平台X上发布了一篇纯技术论文，主要是关于原生稀疏注意力，直指ChatGPT等顶尖大模型背后的Transformer架构最核心的注意力机制。
每日经济新闻
130评论
DeepSeek站在巨人肩上，这个巨人到底是什么？
来论春节期间，中国国产大模型DeepSeek持续引发热议，意外地成为假期最热门的科技话题。 1月20日，中国大模型公司深度求索正式发布推理大模型DeepSeek-R1，一经推出就震撼了业界。1月27日，DeepSeek应用登顶苹果中国区和美国区应用商店免费App下载排行榜。
南方都市报
3评论
21深度｜“杭州之路”，重新定义创业者的应许之地
21世纪经济报道记者柳宁馨杭州报道“为什么是杭州？”以DeepSeek为代表的杭州科创企业火出圈，影响波及全球，引发全国不少城市的追问与反思。2月13日，浙江省委书记王浩与杭州“六小龙”等相关企业负责人举行了一场座谈，会上提到要下功夫打通科技创新和产业创新深度融合的卡点堵点。
21世纪经济报道
1评论

视频

问答