2月18日,马斯克及其 xAI 团队在直播中正式发布了 Grok 3,此前马斯克通过持续的预热宣传,将外界对 Grok3 的期待值推向了前所未有的高度。然而,被马斯克称为“地球上最聪明人工智能”的Grok 3,似乎也翻车了。
震惊!“天下最聪明”的Grok3翻车了:马斯克的人工智能竟然说9.11比9.9大?近日,全球科技圈再次被一则重磅消息刷屏——由特斯拉CEO埃隆·马斯克创立的公司声称其AI系统Grok3是“天下最聪明”的人工智能,却在一场简单的数学比较中“翻车”了!有人称,当输入“9.11比9.
2月18号,美国“钢铁侠”马斯克旗下xAI 发布的Grok-3模型,被马斯克称为“地球上最聪明的AI”,并号称将超越包括ChatGPT、DeepSeek在内的现有AI大模型,根据测试数据显示,Grok-3在美国AIME数学竞赛、GPQA、代码编程方面,性能确实高于GPT-4o、G
近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”然而,有人向Grok3提问“9.11与9.9哪个大?
9.11和9.9哪个大?这是一个曾让不少大模型“翻车”的数学题。北京时间2月19日,在马斯克发布自称“ 世界上最聪明的人工智能”Grok-3后,有用户尝试测试版本,发现该模型在不加任何定语及标注的情况下,无法正确回答刁难AI大模型的经典问题。
万亿算力背后的残酷真相:边际效应已然显现 1. 算力军备竞赛数据对比 模型 显卡数量 训练时长 训练成本 性能表现 Grok-3 20 万 H100 2 亿小时 超 50 亿美元 MMLU 评分 89.75 DeepSeek-V3 2000 H800 2 个月 600 万美元 MMLU 评分 88.92 GPT-4o 未公开 未公开 约 1 亿美元 MMLU 评分 87.35 触目惊心的性价比:Grok-3 耗费超 DeepSeek-V3 830 倍的硬件资源,性能提升却不足 1% 25 2. 行业专家深度剖析 达观数据张健:“Grok-3 遵循‘大力出奇迹’的缩放定律,更像是用金砖铺路的奢靡实验” Omdia 分析师王珅:“xAI 的算力部署激进程度前所未闻,但边际收益已逼近临界点” 韦豪创芯王智:“基础架构创新停滞,堆算力成为唯一可见路径” .
埃隆·马斯克最新AI大模型Grok3今日陷入“冰火两重天”!一边是20万块GPU算力碾压ChatGPT、数学1400分登顶全球第一的亮眼数据,另一边却被曝连“9.9和9.11谁大”都答错,网友嘲讽:“这就是‘最聪明AI’?
一、20万张H100堆出的"地表最强",为何栽在小学数学题?"这不是AI进化史,这是马斯克的大型打脸现场!" 当马斯克在迪拜世界政府峰会上宣称Grok3"超越任何已发布模型"时,全球科技圈都以为见证了一个新王者的诞生。
2025年2月18日,埃隆·马斯克的xAI公司正式发布第三代大模型Grok 3,其性能较前代提升了一个数量级,训练依托20万块英伟达H100 GPU集群,总计算量达2亿GPU小时,是Grok 2的10倍。
近日,全球科技界迎来了一场重量级发布,特斯拉和SpaceX的创始人埃隆·马斯克旗下的人工智能公司xAI,正式推出了其最新一代大模型——Grok 3。这款模型在发布会上被马斯克誉为“地球上最聪明的人工智能”,引起了广泛关注。
马斯克又搞了个大动作,xAI团队发布了Grok3,宣称这是“天下最聪明”的AI。按照马斯克的说法,这玩意儿在数学、科学和编程测试里把其他主流模型都秒了,甚至还能参与SpaceX的火星任务计算,未来三年内有望实现诺贝尔奖级别的突破。听起来是不是很牛?但事实真的如此吗?
一、基础逻辑能力崩塌:数学物理双翻车致命数值认知缺陷在用户实测中,Grok3将"9.11>9.9"作为结论输出,错误率高达97%23。该缺陷直接暴露模型底层数理逻辑架构存在系统性漏洞,导致投资者紧急撤回xAI的2.3亿美元B轮融资。
2025 年 2 月 18 日,埃隆・马斯克(Elon Musk)旗下的 xAI 公司在直播中发布了其最新一代大语言模型 Grok 3。然而,这场备受瞩目的发布会却出现了翻车事件,引发了广泛的关注和讨论。
嘿,你知道吗?马斯克的xAI团队刚发布的Grok3“翻车”啦!马斯克之前可是把Grok3吹得神乎其神,说它是“地球上最聪明的AI”,还打算用它做SpaceX火星任务计算呢,说三年内能有诺贝尔奖级突破。结果呢,有人拿“9.11和9.9哪个大”这个问题一测,Grok3居然答错了!