红星资本局7月17日消息,今日,AI大模型在数学上的翻车话题引发不小关注。一道“9.11和9.9哪个大”的简单数学题,竟困住了海内外一众AI大模型平台。数学偏科8个大模型全答错9.11和9.9哪个更大?
南都讯 马斯克旗下的xAI团队于2月18日发布了其旗下的Grok3大模型,宣称其在数学、编程等领域“超越所有主流模型”,但实际直播演示中,却多次“翻车”,引发广泛质疑。据悉,Grok3消耗了DeepSeek V3的263倍算力,但性能提升仍然有限,又被网友调侃为“浪费算力的硅基资源毁灭者”。【视频编辑/剪辑陈皓晖】
7月13日,最新一期的《歌手》公布排名:孙楠得票13.8%,外国歌手香缇莫得票13.11%。这引发了一些网友对排名的质疑。有网友认为13.11%大于13.8%,因此,香缇莫的得票率比孙楠高。随后,关于13.8%和13.11%大小比较,一度成为了网络上的热门话题。
上海人工智能实验室今天公布了多名“AI考生”参加今年中国高考的成绩,阿里Qwen2-72B、GPT-4o和“书生·浦语”2.0文曲星(InternLM2-20B-WQX)成为三甲,得分率均超过70%。大部分“AI考生”在语文、英语科目上表现良好,但数学成绩不如人意。
9.11和9.9哪个大?这是一个曾让不少大模型“翻车”的数学题。北京时间2月19日,在马斯克发布自称“ 世界上最聪明的人工智能”Grok-3后,有用户尝试测试版本,发现该模型在不加任何定语及标注的情况下,无法正确回答刁难AI大模型的经典问题。