马斯克 Grok 3 登顶!20 万 GPU 堆出的 AI 能走多远?划重点性能碾压全场Grok 3 以 1400 + 分刷新 AI 竞技场纪录,在数学、编程测试中全面超越 ChatGPT 和 DeepSeek。
最近,马斯克发布的Grok 3 AI大模型发布会引发热议。不少人被它在数学、科学和编程基准测试中超越GPT-4o、DeepSeek V3等主流模型的亮眼成绩吸引,其推理模型跑分也打败了同等级对手,一时间,满屏都是夸赞之声。
北京时间 2 月 18 日中午,埃隆·马斯克旗下的人工智能公司 xAI 重磅发布了 Grok 3 系列模型,宣称其在数学、科学和编码基准测试中,击败了 Google Gemini、DeepSeek V3、Claude 以及 OpenAI 的 GPT-4o。
《Grok3数学实力碾压DeepSeek?实测结果太“意外”了》 马斯克再放大招!Grok3“称霸”AI圈? 哇塞!马斯克这次又在AI圈扔下一颗超级炸弹啦!2025年2月18日,他带着xAI团队搞出的动静,简直就像“硅谷版春晚”!
尤其在推理方面,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等测试中取得了压倒性的优势,最高分达到 96 分,超过了 o3 mini、o1 和 DeepSeek-R1 等前沿模型。
2 月 18 日,科技圈迎来重磅消息:埃隆・马斯克旗下的 xAI 公司,终于发布了备受瞩目 Grok 3 聊天机器人!这一动作,瞬间将 AI 领域的竞争热度拉到新高度,直接向 OpenAI、DeepSeek 等行业巨头发起新一轮挑战。
尤其在推理方面 ,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等测试中取得了压倒性的优势,最高分达到 96 分,超过了 o3 mini、o1 和 DeepSeek-R1 等前沿模型。
Grok3 是马斯克旗下 xAI 公司发布的基座大模型,它的发布在 AI 领域引起了广泛关注,以下是对 Grok3 的多维度评价:● 技术突破与核心优势: ○ 推理能力的显著提升:通过引入“思维链(Chain of Thought)”机制,Grok3 实现了分步骤逻辑推理的能力,
据马斯克发布Grok-3时介绍,在数学推理、科学逻辑推理和代码写作等能力表现方面,xAI此次发布的Grok-3和Grok-3 mini两款模型,在 Math、Science和 Coding三项Benchmarks测试中,均取得了比Gemini-2 pro、DeepSeek-v3、GPT-4o更优的性能表现。
Grok 3 真能把 DeepSeek 和 OpenAI 的 ChatGPT 4o 比下去吗?数学竞赛登顶:在 AIME 2025 数学测试里,Grok 3 考了 93 分,刷新了纪录,比 DeepSeek-R1和 GPT-4o高多啦。