柯男数学推理

资讯

新鲜早科技丨马斯克的Grok 3数学推理性能超GPT-4o；OpenAI考虑设立特殊投票权以抵御敌意收购；官方回应“AI公务员”上岗
21世纪经济报道新质生产力研究院综合报道早上好，新的一天又开始了。在过去的24小时内，科技行业发生了哪些有意思的事情？来跟21tech一起看看吧。【巨头风向标】1、马斯克发布Grok 3，数学推理性能超GPT-4o。
21世纪经济报道
数学的推理和命题
这篇文章谈一谈什么是数学推理，知道如何简单地解决问题。由于两个质数的和既可以是偶数也可以是奇数，所以给定的命题可以是真，也可以是假。
风云中穿梭数海中遨游
1评论
真正的“理科推理”，被他玩明白了
推理，逻辑学中思维的基本形式之一，是由一个或几个已知的判断推出新判断的过程。推理小说，按理来说是最接近数学美感的文学形式，在文科的范畴内置入理科的内容。
新京报
3评论
跟福尔摩斯学推理，在趣味谜题中盘逻辑，提升数学素养真容易！
很多时候，许多孩子学不好数学只是一种表象，他们并非真的对数学知识毫无概念，而是在读懂题目、抽象出数学关系方面出了问题。
好玩的数学
不蒸馏R1也能超越DeepSeek，上海 AI Lab 用RL突破数学推理极限
书理投稿自凹非寺。上海AI Lab提出了基于结果奖励的强化学习新范式——量子位 QbitAI · 头条号签。
量子位
41评论
马斯克Grok-3发布会坐C位的两名华人是谁？
视频显示，马斯克、吉米·巴、吴宇怀以及xAI首席工程师伊戈尔・巴布施金并肩而坐。吴宇怀的主要研究方向是打造具备推理能力的机器，是自训练增强推理模型STAR、语言模型Minerva、定理证明器Alpha Geometry等项目的作者或核心贡献者，在国际顶会发表过诸多论文，比如在《Nature》上发表论文《Solving Olympiad Geometry Without Human Demonstrations》。
观察者网
16评论
大模型推理新范式！清华＆蚂蚁：用编程思维来思考，用自然语言来表达
过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。2024 年 9 月，OpenAI 携 o1 模型吹响推理革命的号角，以惊人的思维链长度刷新认知边界。
新浪财经
1评论
DeepSeek颠覆了什么？——大模型“国产之光”破局的启示
一家人工智能初创企业浅浅扇动两下翅膀，即掀起全球科技界的一阵“海啸”。短短30天，中国初创企业深度求索（DeepSeek）先后发布两款性能比肩GPT-4o的大模型，“1/18的训练成本、1/10的团队规模、不分伯仲的模型性能”令硅谷大受震撼。
光明网
11评论
还没发布，xAI 工程师公开承认 Grok 3 不如 OpenAI，遭马斯克怒火解雇！马斯克：Grok 3 打遍天下无敌手
在 2025 年 2 月 13 日迪拜世界政府峰会上，埃隆·马斯克与阿联酋国务部长 Omar Sultan Al Olama 进行了一场关于 AI 未来的对话。
InfoQ
3评论
阿里云通义开源最强过程奖励PRM模型，7B尺寸比GPT-4o更能发现推理错误
1月16日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型；在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。
封面新闻
2评论

问答