梁文锋什么大语言模型

资讯

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么
2月18日，在大洋彼岸的马斯克秀出最新大模型Grok 3当天，国产AI公司深度求索（DeepSeek）最新一篇论文引发关注，创始人梁文锋在署名之列，并2月16日提交到预印本平台arxiv。
澎湃新闻
1评论
梁文锋: 从湛江少年到全球科技界的传奇
他创立的DeepSeek不仅在全球范围内引发了轰动，更对美国科技巨头造成了前所未有的冲击。这位来自中国广东湛江的85后创业者，凭借其卓越的创新思维和实践，一举超越了ChatGPT，成为全球瞩目的焦点。
大河财经
跟随者永远吃灰，梁文锋另辟蹊径，中国的未来在原创突破
长期以来，国外流传着一种说法，中国人善于模仿，不会创新。记得一个美国人说过这样的话:中国人是善于学习，善于模仿，不过没关系，等他们快学会我们现有的技术后，我们会很快推出新的技术。
渭滨野客
18评论
DeepSeek的创始人梁文锋：以开源推动AI技术的普惠发展
作为一家专注于开发大语言模型的科技公司，DeepSeek不仅在技术上取得了突破，更以其开源策略在全球范围内引发了广泛关注。
哇哒西吖
刚刚！DeepSeek梁文锋亲自挂名，公开新注意力架构NSA
最近大模型的突破 —— 如 OpenAI 的 o 系列模型、DeepSeek-R1 和 Gemini 1.5 Pro—— 已经能使得模型能够处理整个代码库、长文档、在数千个 token 上保持连贯的多轮对话，并在长距离依赖关系中进行复杂推理。作者在一个 8-GPU A100 系统上评估了 NSA 相对于 Full Attention 的计算效率。
机器之心Pro
147评论
梁文锋、杨植麟论文“撞车”，直指算法优化，挑战ChatGPT核心机制！风投公司RAI Digital联合创始人：AI无需读完整本书，将更快、更高效
北京时间2月18日，在马斯克还在庆祝Grok 3模型正式发布的时候，DeepSeek官方在社交平台X上发布了一篇纯技术论文，主要是关于原生稀疏注意力，直指ChatGPT等顶尖大模型背后的Transformer架构最核心的注意力机制。
每日经济新闻
132评论
圈内人长文解秘，毫不意外的梁文锋
长期征集日子很难，生活不容易，每个人都有自己的苦，有苦说不出的感觉，受苦的人最懂。和吃苦相比，有苦难言，无人问津，可能比苦本身还难受。重生之后，叶檀老师变了很多，变得能吃苦，吃自己的苦，吃别人的苦。她说，有苦我们一起分担。
叶檀财经
67评论
DeepSeek｜85后小镇创始人梁文锋：不声不响，干翻硅谷
今年年初，DeepSeek站在了聚光灯下，直到今天，依旧热的发烫。一切源自1月20日，深度求索发布的一款产品DeepSeek R1。
东方野风
外媒：中国AI模型震惊硅谷
来源：环球时报英国《金融时报》1月25日文章，原题：中国小型人工智能初创公司深度求索如何震惊硅谷本周，中国一家人工智能（AI）实验室发布尖端模型的“技术配方”，此举不仅震惊世界，也使其低调的负责人变成无视美国阻止中国高科技雄心企图的民族英雄。
环球网
28评论
21深度｜“杭州之路”，重新定义创业者的应许之地
21世纪经济报道记者柳宁馨杭州报道“为什么是杭州？”以DeepSeek为代表的杭州科创企业火出圈，影响波及全球，引发全国不少城市的追问与反思。2月13日，浙江省委书记王浩与杭州“六小龙”等相关企业负责人举行了一场座谈，会上提到要下功夫打通科技创新和产业创新深度融合的卡点堵点。
21世纪经济报道
1评论
量化巨头创始人大动作！
11月2日，幻方量化公告称，创始人梁文锋持股科技公司——杭州深度求索人工智能基础技术研究有限公司，发布开源代码模型DeepSeek Coder。
中国证券报
“东方神秘力量”爆火
作者丨孔海丽编辑丨骆一帆DeepSeek再次爆火。近日，国内AI初创公司DeepSeek发布了新一代大语言模型DeepSeek-V3，同时宣布开源。在多项基准测试中，V3的成绩超越了主流开源模型，并和世界顶尖的闭源模型不分伯仲。
21世纪经济报道
内地“十角兽”何时来港上市？这6家公司，足以震撼市场……
其实，中国内地尚有多家实力十分雄厚、盈利能力超强的巨型企业未上市，香港商报综合市场意见整理出其中6家公司，只要其中任何一家来港上市都足以震撼整个市场。
香港商报
3评论
爆火！Deepseek登顶苹果中国及美国免费应用榜，创始人是湛江人
1月27日，由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。据DeepSeek介绍，R1的预训练费用只有557.
极目新闻
1评论

加载更多

视频

问答

复旦团队发布国内首个类ChatGPT模型MOSS，将为国内大语言模型的探索和应用带来哪些影响？
每经AI快讯，从复旦大学自然语言处理实验室获悉，国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台（https://moss.fastnlp.top/），邀公众参与内测。
头条问答