杨植麟梁文峰同时发论文

资讯

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么
2月18日，在大洋彼岸的马斯克秀出最新大模型Grok 3当天，国产AI公司深度求索（DeepSeek）最新一篇论文引发关注，创始人梁文锋在署名之列，并2月16日提交到预印本平台arxiv。
澎湃新闻
1评论
“梁文锋、杨植麟同一天发论文，关注大模型的未来趋势“
更有趣的是，两家公司的技术派明星创始人都亲自参与了研究，他们的名字分别出现在各自的论文和技术报告中，此举引发了外界的强烈关注。
人工智能学家
4评论
梁文锋、杨植麟论文“撞车”，直指算法优化，挑战ChatGPT核心机制！风投公司RAI Digital联合创始人：AI无需读完整本书，将更快、更高效
北京时间2月18日，在马斯克还在庆祝Grok 3模型正式发布的时候，DeepSeek官方在社交平台X上发布了一篇纯技术论文，主要是关于原生稀疏注意力，直指ChatGPT等顶尖大模型背后的Transformer架构最核心的注意力机制。
每日经济新闻
130评论
梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么
2月18日，在大洋彼岸的马斯克秀出最新大模型Grok 3当天，国产AI公司深度求索（DeepSeek）最新一篇论文引发关注，创始人梁文锋在署名之列，并2月16日提交到预印本平台arxiv。
澎湃新闻
3评论
杨植麟和梁文锋，论文撞车了
DeepSeek 发布的论文，标题名为:《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。
硅星人
18评论
既生杨植麟，何生梁文锋
梁文峰与杨植麟，DeepSeek与月之暗面，颇有些当代版“既生瑜，何生亮”的意思。需要提醒大家，即便如今所有的镁光灯都聚焦在DeepSeek-R1上，但光环之外仍有人在努力，简单地归因和粗暴地判断于当下而言都是极其傲慢的。
智及
钛媒体独家｜腾讯计划投资月之暗面，杨植麟最新发言：今天人类对AI信任还不够
5月20日消息，钛媒体App独家获悉，腾讯公司正考虑投资大模型初创公司月之暗面，从而为腾讯与kimi智能助手之间更深层次合作铺平道路。
钛媒体APP
6评论
月之暗面杨植麟：大模型开发是“承包森林”
本报记者李玉洋上海报道国内大模型创业公司月之暗面（Moonshot）最近又迎来一阵风。公开报道显示，月之暗面正在进行新一轮融资，估值达到30亿美元（约合人民币217.8亿元），而新的投资者中出现了腾讯。
中国经营报
月之暗面创始人杨植麟：AI创业和做摇滚歌手本质相通，都与创新有关
5月18日上午，第五届上海创新创业青年50人论坛上，Moonshot AI月之暗面创始人杨植麟作为演讲嘉宾出席。主办方供图“植麟儿时梦想过做摇滚歌手、流浪诗人，而今天在这里谈未来，这之间有什么关系？
澎湃新闻
6评论
马斯克的Grok3虽然霸榜，但看到差距我笑了，梁文峰论文封神
2025年2月18日，马斯克旗下xAI发布的Grok3以"推理能力突破"为卖点引发轰动。其训练依托搭载10万块英伟达H100 GPU的Colossus超级计算机，累计消耗2亿GPU小时，参数规模达到惊人的1.8万亿。
荒漠古堡
中国AI再出王炸！梁文峰团队公开革命性NSA架构，全球科技圈炸锅
中国AI再出王炸！梁文峰团队公开革命性NSA架构，全球科技圈炸锅了！一、颠覆性突破：NSA架构改写AI游戏规则2025年2月，中国AI领域再掀狂潮！DeepSeek创始人梁文峰团队发布论文《原生稀疏注意力机制》（NSA），这项技术被硅谷专家称为“AI领域的第三次工业革命”。
一心一意奶茶
“AI 三杰”为何没在故乡创业？肯定不是因为缺好大学
在中国当下的环境中，无论创业还是工作，城市、行业的重要性远超过大学对个人的赋能。因为Deepseek爆火，网民总结了中国 “AI 三杰”的说法:Deepseek创始人梁文锋、kimi 创始人杨植麟，以及人工智能领域杰出科学家何恺明。
今纶
2评论
“AI三杰”都是广东人，为何都没在广东发展？
最近在网上看多一个说法:中国“AI三杰”都是广东人，但都没有在广东创业和发展。公开资料显示，这三位蜚声全球的AI大牛都很年轻，其中两个是80后、一个是90后，一个在杭州上大学和创业，一个在北京上大学和创业，另一个在美国MIT任教。
城市战争
41评论
与DeepSeek并称双子星，月之暗面投流刹车意味着什么
DeepSeek的出现，搅乱了此前国内“稳定”了一年的AI大模型创业圈“6+2”格局，快速吸引了所有的注意力。
南方都市报
5评论
AI“六小虎”求变：DeepSeek冲击下的商业化抗争
21世纪经济报道记者申俊涵北京报道开年以来，中国人工智能公司深度求索（DeepSeek）成为全球科技圈、创投圈关注的焦点。其在1月20日推出的DeepSeek-R1推理模型，以极低成本实现媲美OpenAI o1模型的性能。
21世纪经济报道

加载更多

视频