逻辑推理被认为是当前大模型最难以攻克的一道关卡。某款大模型关于“9.11和9.9两个数字哪个更大”的回答。图/某款大模型截图文| 王晓凯一道小学数学题,成功难倒了超过一半的大模型。近日,据第一财经报道,经测试,在“9.11和9.
作者 | ZeR0 程茜编辑 | 漠影智东西12月21日报道,今日,OpenAI“连续12日圣诞发布”终于迎来激动人心的大结局,OpenAI推出重磅收官新品,其迄今最强前沿推理模型的升级版——o3。OpenAI号称o3在一些条件下接近通用人工智能(AGI)。
每经记者:岳楚鹏 每经编辑:兰素英1月20日发布的DeepSeek-R1模型让开发公司DeepSeek在全球的热度持续攀升。1月27日,DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜,甚至超越了大众熟知的ChatGPT。
12月31日,国内明星大模型创业公司北京智谱华章科技有限公司推出基于扩展强化学习技术训练的推理模型GLM-Zero-Preview,擅长处理数理逻辑、代码和需要深度推理的复杂问题。GLM-Zero-Preview是GLM-Zero的初代版本。