21世纪经济报道新质生产力研究院综合报道早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起看看吧。【巨头风向标】1、马斯克发布Grok 3,数学推理性能超GPT-4o。
视频显示,马斯克、吉米·巴、吴宇怀以及xAI首席工程师伊戈尔・巴布施金并肩而坐。吴宇怀的主要研究方向是打造具备推理能力的机器,是自训练增强推理模型STAR、语言模型Minerva、定理证明器Alpha Geometry等项目的作者或核心贡献者,在国际顶会发表过诸多论文,比如在《Nature》上发表论文《Solving Olympiad Geometry Without Human Demonstrations》。
过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。2024 年 9 月,OpenAI 携 o1 模型吹响推理革命的号角,以惊人的思维链长度刷新认知边界。
一家人工智能初创企业浅浅扇动两下翅膀,即掀起全球科技界的一阵“海啸”。短短30天,中国初创企业深度求索(DeepSeek)先后发布两款性能比肩GPT-4o的大模型,“1/18的训练成本、1/10的团队规模、不分伯仲的模型性能”令硅谷大受震撼。
1月16日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型;在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。