1月28日,英伟达暴跌16.86%,5800亿美元蒸发,创造史上最大市值损失记录。全美半导体行业,也集体陷入了恐慌:博通跌超17%,台积电跌超13%,美国科技跌超11%,Arm Holdings跌超10%,AMD跌超6%,阿斯麦跌超5%…
北京时间2月18日,在马斯克还在庆祝Grok 3模型正式发布的时候,DeepSeek官方在社交平台X上发布了一篇纯技术论文,主要是关于原生稀疏注意力,直指ChatGPT等顶尖大模型背后的Transformer架构最核心的注意力机制。
来源:环球时报 英国《金融时报》1月25日文章,原题:中国小型人工智能初创公司深度求索如何震惊硅谷本周,中国一家人工智能(AI)实验室发布尖端模型的“技术配方”,此举不仅震惊世界,也使其低调的负责人变成无视美国阻止中国高科技雄心企图的民族英雄。
潮新闻客户端 杨新元一我写这篇文章,是有感而发。今年春节,全中国、甚至全世界,人们谈论最多的话题可能就是DeepSeek的横空出世,以及它的创始人梁文锋。DeepSeek是什么?它是一个中国团队开发的AI大模型。一经推出就引发了全球范围内的广泛关注。
1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。据DeepSeek介绍,R1的预训练费用只有557.