gpt测试降智

资讯

不会数学了！GPT-4“智力”大幅下降
参考消息网7月22日报道据美国《财富》杂志网站7月20日报道，斯坦福大学的一项研究发现，广受关注的聊天机器人ChatGPT在6月份执行某些任务的表现比3月份的时候变得更糟了。
参考消息
18评论
GPT3是暴力美学巅峰？智源研究院欲开发通用智能图灵测试
是一个极其烧钱、极其庞大、极其有算力的系统。8月24日，北京智源人工智能研究院在北京举行“人工智能的认知神经基础”重大研究方向发布会。
澎湃新闻
OpenAI为节约成本偷工减料？史上最强大模型GPT-4“变笨”引发全网讨论，输出质量被质疑明显下降
每经记者：蔡鼎每经编辑：谭玉涵如今距离OpenAI于3月中旬推出其最新版本的大型语言模型GPT-4已经有近3个月的时间。
每日经济新闻
阿里GPT测评：AI摩尔定律时代真的来了？
不久前，OpenAI CEO 、“ChatGPT之父”Sam Altman发文指出，全球AI运算量每隔18个月就会提升一倍。
电脑报
实锤GPT-4真变笨了：3个月内数学能力雪崩式下降，代码能力也变差
具体而言，通过四个任务研究过 GPT-3.5 和 GPT-4 的 2023 年三月版和六月版的生成结果后，研究者发现这两个 LLM 确实在一些指标上变得更差了，尤其是 GPT-4 求解数学问题的能力，可以说是雪崩式下降 —— 三月版 97.6% 的准确度到六月只剩 2.4%。重点是，我们需要知道:为了提升模型的某些方面而执行更新时，模型的其它能力会不会受到损伤?
机器之心Pro
135评论
猴子，人类，GPT
记者 | 吴洋洋编辑 | 陈锐题图来源 | 人文清华讲坛3月22日，微软发布了一篇长达154页的论文《Sparks of Artificial General Intelligence: Early experiments with GPT-4》，公布对GPT-4展开的全面能力
第一财经YiMagazine
3评论
AI较量：2024年9月最新国产大模型与GPT的真实能力测试，谁更强？
原文链接:AI较量:国产大模型与ChatGPT的真实能力测试，谁更胜一筹?国产AI大模型与OpenAI的ChatGPT在这一领域展开了激烈竞争。
晒应用导航
3评论
你听说GPT4.0了吗？什么是GPT4.0？让我来告诉你
你听说GPT4.0了吗?如果没有，那你一定是住在火星上了。GPT4.0是OpenAI最新的人工智能系统，它可以用文字和图片来交流，创造，解决问题。
长风之地
1评论
美媒：为什么ChatGPT会让我们的智力退化
参考消息网7月28日报道美国《福布斯》杂志网站7月27日发表文章称，在某些方面，ChatGPT可能让我们变得更聪明;
参考消息
比GPT-3.5 Turbo便宜超60% OpenAI推出小模型卷性价比
每经记者：可杨每经编辑：梁枭7月18日，OpenAI正式推出新一代入门级别人工智能模型“GPT-4o mini”，称这款新模型是“功能最强、性价比最高的小参数模型”。从OpenAI官网的介绍来看，GPT-4o mini在文本智能和多模态推理方面的基准性能超越了GPT-3.
每日经济新闻
谷歌顶不住了，官宣Gemini降价至GPT-4o mini的一半。
先是推出了新模型Gemini 1.5 Pro的0801测试版，踢馆GPT-4o;这样还不够，现在谷歌又要从价格上压OpenAI的GPT-4o mini一手，Gemini 1.5 flash定价降低至GPT-4o mini的一半。
夕小瑶科技说
9评论
一文带你入门人工智能之“到底什么是G P T？”
这是一种基于人工智能的自然语言处理技术，通过使用大量的文本数据进行训练，可以生成自然的语言文本，例如文章、新闻、评论、对话等等。
阿生的AI视界
3评论
13.11＞13.8冲上热搜，一道题让人类AI集体降智？LLM致命缺点曝光
【新智元导读】13.8和13.11哪个大?这个问题不光难倒了部分人类，还让一票大模型折戟。其实，无论是比大小，还是卷心菜难题，都揭示了LLM在token预测上的一个重大缺陷。
新智元
4评论

加载更多

视频