出品|虎嗅科技组作者|余杨编辑|苗正卿头图|视觉中国12月16日下午,我照常使用Kimi,突然发现Kimi数学版的和蔼小眼镜logo的眼镜框变大了。鼠标移过去一看,“Kimi数学版”已经正式改名为“Kimi视觉思考版”。这让我想起上周为Kimi数学版写的测评文章。
“给娃儿辅导奥数题,问了多个AI平台,每个答案都不一样。”近日,重庆家长刘先生向上游新闻(报料邮箱baoliaosy@163.com)记者反映:同一道奥数题,百度、阿里云、今日头条等国内4个主流AI大模型平台,竟然给出了不同的答案。
红星资本局7月17日消息,今日,AI大模型在数学上的翻车话题引发不小关注。一道“9.11和9.9哪个大”的简单数学题,竟困住了海内外一众AI大模型平台。数学偏科8个大模型全答错9.11和9.9哪个更大?
具体而言,在满分 73 分、及格线为 43.8 分的情况下,六家大模型产品的分数结果分别为:GLM-4-0520 > 智谱清言 > GPT-4o > 豆包 > 文心 4 = 百川 4 > 通义千问 2.5 。
13.11和13.8谁大?——这样一道简单的“小升初”数学题难倒一众网友和大模型。 上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高?
题目;方方放学回家,发现楼梯坏了,只好怕楼梯,爬到五楼时,他发现自己才爬了一半,那么方方家住在_楼。孩子做的是8楼,我看的是9楼.但特么都错了,正确答案是9楼!理由是一楼不用爬,不算?这出题的脑子有问题吗。