具体而言,通过四个任务研究过 GPT-3.5 和 GPT-4 的 2023 年三月版和六月版的生成结果后,研究者发现这两个 LLM 确实在一些指标上变得更差了,尤其是 GPT-4 求解数学问题的能力,可以说是雪崩式下降 —— 三月版 97.6% 的准确度到六月只剩 2.4%。重点是,我们需要知道:为了提升模型的某些方面而执行更新时,模型的其它能力会不会受到损伤?
记者 | 吴洋洋编辑 | 陈 锐题图来源 | 人文清华讲坛3月22日,微软发布了一篇长达154页的论文《Sparks of Artificial General Intelligence: Early experiments with GPT-4》,公布对GPT-4展开的全面能力
每经记者:可杨 每经编辑:梁枭7月18日,OpenAI正式推出新一代入门级别人工智能模型“GPT-4o mini”,称这款新模型是“功能最强、性价比最高的小参数模型”。从OpenAI官网的介绍来看,GPT-4o mini在文本智能和多模态推理方面的基准性能超越了GPT-3.
先是推出了新模型Gemini 1.5 Pro的0801测试版,踢馆GPT-4o;这样还不够,现在谷歌又要从价格上压OpenAI的GPT-4o mini一手,Gemini 1.5 flash定价降低至GPT-4o mini的一半。