逻辑推理模型

资讯

分不清9.11和9.9大小，暴露大模型逻辑推理能力短板 | 新京报快评
逻辑推理被认为是当前大模型最难以攻克的一道关卡。某款大模型关于“9.11和9.9两个数字哪个更大”的回答。图/某款大模型截图文| 王晓凯一道小学数学题，成功难倒了超过一半的大模型。近日，据第一财经报道，经测试，在“9.11和9.
新京报评论
2评论
有道子曰-o1推理模型正式发布
每经AI快讯，据网易有道官微消息，1月22日，有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”，并正式开源。
每日经济新闻
什么是推理大模型？什么时候该使用推理大模型？
DeepSeek R1推理大模型与DeepSeek V3模型的区别是什么?什么时候该使用推理大模型?但是，相比较此前的GPT-4o，推理大模型的区别是什么?
数据学习DataLearner
14评论
OpenAI最强推理模型o3发布！AGI测试能力暴涨
作者 | ZeR0 程茜编辑 | 漠影智东西12月21日报道，今日，OpenAI“连续12日圣诞发布”终于迎来激动人心的大结局，OpenAI推出重磅收官新品，其迄今最强前沿推理模型的升级版——o3。OpenAI号称o3在一些条件下接近通用人工智能（AGI）。
智东西
2评论
记者实测 | DeepSeek-R1对决四款主流推理模型：基础题意外“翻车”，高难度推理碾压ChatGPT o1
每经记者：岳楚鹏每经编辑：兰素英1月20日发布的DeepSeek-R1模型让开发公司DeepSeek在全球的热度持续攀升。1月27日，DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜，甚至超越了大众熟知的ChatGPT。
每日经济新闻
38评论
阶跃星辰发布推理模型：要将推理能力融入更多交互形态的大模型
1月16日，国内大模型“六小虎”之一的阶跃星辰发布自研推理模型Step Reasoner mini。在AIME和Math等数学基准测试上与OpenAI o1-mini水平相当。
澎湃新闻
天工版o1、4o同时上线！超强逻辑推理秒杀数学竞赛，实时语音陪聊
【新智元导读】今天，「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了，人人可玩的那种。
新智元
2评论
智谱发布推理模型初代版本
12月31日，国内明星大模型创业公司北京智谱华章科技有限公司推出基于扩展强化学习技术训练的推理模型GLM-Zero-Preview，擅长处理数理逻辑、代码和需要深度推理的复杂问题。GLM-Zero-Preview是GLM-Zero的初代版本。
澎湃新闻
密切跟进OpenAI，国产o1类推理模型陆续登场
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪2025年第一个月，国产o1类模型开始密集更新，发布者包括“六小虎”中的月之暗面、阶跃星辰，以及独立于创业公司格局外的DeepSeek。
界面新闻
3评论
美AI优势加速崩盘，中国新模型无视封锁，或倒逼英伟达产能过剩？
中国版OpenAI两大新模型横空出世，直接让美国AI的领先优势瞬间崩盘，同时也证明了美对华费尽心思的AI封锁已经彻底失效。
向知平说
58评论

视频