当美国商务部还在绞尽脑汁更新实体清单时,DeepSeek团队用MoE架构的深度求索大模型,在AGI竞技场上撕开了第一道血色黎明——这家长于中文语境的AI新贵,其最新模型综合性能已达GPT-4的95%,推理成本却仅有后者的1%。
一个没有超大规模训练数据,没有超级计算机,也没有 GPU 的公司,凭什么能击穿美国 AI?美国对华科技制裁一次次的碰壁,说明围绕整个 AI、算力、科技所构建的游说和加密货币搭建起来的新金融投机矩阵正在走向崩溃。
在专业的大模型排名 Arena 上,DeepSeek - R1 基准测试成绩斐然,已升至全类别大模型第三 ,其中在风格控制类模型 分类中与 OpenAI o1 并列第一,竞技场得分达到 1357 分,还略超 OpenAI o1 的 1352 分。
1月28日凌晨,多模态大模型Janus-Pro悄然上线,这也是国内AI创业公司DeepSeek在一个月内上线的第三款大模型。受到“DeepSeek冲击”影响,英伟达股价暴跌6000亿美元,甚至殃及美股和日股市场。