每经记者:郑雨航 每经编辑:程鹏,兰素英传说中的“草莓”模型今天在没有任何预告下忽然上线了! OpenAI最新发布的模型名为o1,是系列推理模型的首批版本,现阶段推出的是o1-preview(预览版)和o1-mini(迷你版)。
作者|西梅汁编辑|星奈媒体|AI大模型工场18日中午,马斯克掏出号称“地表最强”大模型Grok3。官方宣称,Grok 3和Grok 3 mini在数学、科学和编程基准测试上超越了所有主流模型,包括GPT-4o、Claude 3.
每经记者:郑雨航 每经实习记者:岳楚鹏 每经编辑:兰素英传说中的“草莓”模型今天在没有任何预告下忽然上线了!OpenAI最新发布的模型名为o1,是系列推理模型的首批版本,现阶段推出的是o1-preview(预览版)和o1-mini(迷你版)。
小明 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,AI编程模型的开源王座易主了!Qwen2.5-Coder-32B正式发布,霸气拿下多个主流基准测试SOTA,彻底登上全球最强开源编程模型宝座。更重要的是,在代码能力的12个主流基准上,Qwen2.
智东西2月25日报道,今天,阿里通义千问团队推出QwQ-Max-Preview深度思考模型,并支持联网搜索,展现出超强的通用能力,不仅现场锐评了最新的《哪吒2》电影,还能写代码、做数学题,并可以胜任创意写作、游戏开发等开放性任务。
中证网讯(王珞)《麻省理工科技评论》中国最新发布的大模型评测报告显示,在8个一级大类的600道题目的测试和盲评中,讯飞星火认知大模型V2.0在6个大类中得分率排名第一,在此次评测中表现突出,以81.5分(百分制计)的成绩在本次评测中登顶,荣获“最聪明”的国产大模型称号。
据马斯克发布Grok-3时介绍,在数学推理、科学逻辑推理和代码写作等能力表现方面,xAI此次发布的Grok-3和Grok-3 mini两款模型,在 Math、Science和 Coding三项Benchmarks测试中,均取得了比Gemini-2 pro、DeepSeek-v3、GPT-4o更优的性能表现。
每经AI快讯,3月6日,据零一万物官微消息,零一万物官微宣布开源Yi-9B模型。据介绍,Yi-9B是目前Yi系列模型中代码和数学能力最强的模型,实际参数为8.8B,默认上下文长度为4K tokens。该公司由李开复带队创办。