豆包数学题回答错误

资讯

AI豆包姑娘，数学方面的确不是她的强项呀
这次测试了她在数学方面的能力，说实话的确不咋样。可是他算的结果压根儿就不正确，在我多次跟她说，她是错误的后，她反复算了几次。
品味乐与饵
这道数学题，Kimi和豆包谁答对了？
出品｜虎嗅科技组作者｜余杨编辑｜苗正卿头图｜视觉中国12月16日下午，我照常使用Kimi，突然发现Kimi数学版的和蔼小眼镜logo的眼镜框变大了。鼠标移过去一看，“Kimi数学版”已经正式改名为“Kimi视觉思考版”。这让我想起上周为Kimi数学版写的测评文章。
虎嗅APP
22评论
字节跳动推出豆包大模型，语文不错数学拉跨
不同于国内其他大模型文绉绉的名字，如通义千问、文心一言、讯飞星火，豆包或许是取自“dou bot”的谐音，有着独树一帜的萌系风格。
未名科创
2评论
实际对比deepseek、Chatgpt、豆包、讯飞星火解数学题
今天正好需要一个业务解题，是关于数学类的。分别用deepseek、Chatgpt、豆包、讯飞星火做了解答。
左岸3078
3评论
一道小学奥数题4个AI平台答案不一，专家回应
“给娃儿辅导奥数题，问了多个AI平台，每个答案都不一样。”近日，重庆家长刘先生向上游新闻（报料邮箱baoliaosy@163.com）记者反映：同一道奥数题，百度、阿里云、今日头条等国内4个主流AI大模型平台，竟然给出了不同的答案。
上观新闻
AI也能来高考？“豆包”同学原来是个偏科生 | 大模型测评
5月15日，在2024春季火山引擎Force原动力大会上，字节跳动“豆包”大模型正式亮相，并一口气发布九款豆包大模型。
AI大模型工场
究竟｜9.11比9.8大？大模型们为何会在小学数学题上集体翻车
万亿参数大模型竟然回答不了小学数学题？最近，面对9.11和9.8哪个大的问题上，一波大模型集体翻车了。7月17日，澎湃新闻记者实测13个主流大模型，询问9.11和9.
澎湃新闻
41评论
9.11和9.9哪个大？简单数学题8家AI大模型平台都翻了车
红星资本局7月17日消息，今日，AI大模型在数学上的翻车话题引发不小关注。一道“9.11和9.9哪个大”的简单数学题，竟困住了海内外一众AI大模型平台。数学偏科8个大模型全答错9.11和9.9哪个更大？
红星新闻
6评论
大模型的高考数学成绩单：及格已经非常好了
具体而言，在满分 73 分、及格线为 43.8 分的情况下，六家大模型产品的分数结果分别为:GLM-4-0520 > 智谱清言 > GPT-4o > 豆包 > 文心 4 = 百川 4 > 通义千问 2.5 。
机器之心Pro
1评论
大模型“翻车”小学题？
13.11和13.8谁大？——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉，孙楠以13.8%的投票率位居第三，Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高？
南方都市报
1评论

问答

一个二年级数学题，正确答案明显错误，误人子弟？
题目；方方放学回家，发现楼梯坏了，只好怕楼梯，爬到五楼时，他发现自己才爬了一半，那么方方家住在_楼。孩子做的是8楼，我看的是9楼.但特么都错了，正确答案是9楼！理由是一楼不用爬，不算？这出题的脑子有问题吗。
头条问答