13.8和13.11gpt

资讯

9.11比9.9大？马斯克声称“天下最聪明”的Grok3“翻车了”
近日，马斯克与xAI团队，在直播中正式发布了最新版本Grok3。此前，马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示：“自己整个周末都在和团队打磨产品。”然而据媒体报道，有人测试了最新的Beta版Grok3，并提出了那个经典的用来刁难大模型的问题：“9.
上观新闻
79评论
13.8和13.11哪个大？大模型竟然开始“一本正经地胡说八道”……
图说：不同大模型回答“13.8和13.11哪个大？”13.8和13.11哪个大？综艺节目的选手排名，竟让一道本不该成为争议的“小学数学题”，在网上掀起讨论。不仅部分人类搞不清楚，“聪明”的大模型也洋相百出——简单的常识题对它们来说还是有难度！
新民晚报
2评论
9.11比9.9大？马斯克声称“天下最聪明”的Grok3“翻车了”
近日，马斯克与xAI团队，在直播中正式发布了最新版本Grok3。此前，马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示：“自己整个周末都在和团队打磨产品。”然而据媒体报道，有人测试了最新的Beta版Grok3，并提出了那个经典的用来刁难大模型的问题：“9.
海报新闻
24评论
分不清13.8和13.11哪个大？网友吵翻天
近日，在最新一期的《歌手》节目中，孙楠与外国歌手的微小分数差异，竟引发了网友关于13.8和13.11大小比较的讨论。
长江网
2评论
分不清13.8和13.11哪个大？
孙楠得票13.8%。外国歌手香缇莫得票13.11%。不少网友认为13.11%少于13.8%。关于13.8和13.11大小比较的话题。
光明网
13.11＞13.8冲上热搜，一道题让人类AI集体降智？LLM致命缺点曝光
【新智元导读】13.8和13.11哪个大?这个问题不光难倒了部分人类，还让一票大模型折戟。其实，无论是比大小，还是卷心菜难题，都揭示了LLM在token预测上的一个重大缺陷。
新智元
3评论
与AI相伴这一年
当地时间5月30日，瑞士日内瓦，在国际电信联盟（ITU）“人工智能造福人类全球峰会”期间，一台人工智能的机器人在展台上展示。视觉中国供图无论是否关注，AI都正在深入我们的生活。一年多以前，人们还惊异于ChatGPT的横空出世，如今，许多人已习惯于在工作生活中寻求人工智能的辅助。
中国青年报
Grok3翻车了，“地球上最聪明的AI”就这？
近日，马斯克与xAI团队，在直播中正式发布了最新版本Grok3。此前，马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示：“自己整个周末都在和团队打磨产品。”然而据媒体报道，有人测试了最新的Beta版Grok3，并提出了那个经典的用来刁难大模型的问题：“9.
大象新闻
2评论
GPT太「奢侈」，平替大汇总来了，再也不用担心部署大难题
近年来，生成式预训练模型的兴起彻底颠覆了自然语言处理领域，其影响甚至已经延伸到其他多种模态。然而，像 ChatGPT 和 GPT-4 这样的模型，由于其巨大的模型规模与计算复杂度、复杂的部署方式以及未开源的训练模型，这些因素都限制了他们在学术界和工业界的推广与应用。
机器之心Pro
1评论
一道数学题吵翻天，实测十家大模型：ChatGPT差点翻车
13.11和13.8谁大？——这样一道简单的“小升初”数学题难倒一众网友和大模型。“13.8 13.11”已经成为网络新热梗。上周五（7月12日）综艺《歌手2024》投票率出炉，孙楠以13.8%的投票率位居第三，Chanté Moore以13.11%的投票率排在第四。
南方都市报
1评论
分不清9.9与9.11谁大？大模型数学能力堪忧
每经记者：可杨每经编辑：梁枭13.11%和13.8%哪个大？9.9和9.11哪个大？两道小学数学难度的题目难倒了众多主流大模型，在比大小的过程中，不少大模型给出了错误的答案。
每日经济新闻
2评论
9.11和9.9哪个大？AI终于会答了
9月13日，OpenAI发布新模型o1，此前被网友诟病的大模型比较不出9.11和9.9大小的问题，终于在新版大模型中得到了正确结论。经过测试，o1-preview依旧给出错误答案，认为9.11更大。而o1-mini经过短暂“思考”，纠正了此前错误：“抱歉，上次的回答有误。9.
新黄河
9.11比9.9大？马斯克声称“天下最聪明”的Grok3“翻车了”
近日，马斯克与xAI团队，在直播中正式发布了最新版本Grok3。此前，马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示：“自己整个周末都在和团队打磨产品。”然而据媒体报道，有人测试了最新的Beta版Grok3，并提出了那个经典的用来刁难大模型的问题：“9.
环球时报
82评论
GPT4/3.5/文心、千问、星火、商汤模型究竟哪个更好用？权威评测
进入2023年以来，大模型在人工智能领域受到越来越多的关注，越来越多中国科技企业推出了自有大模型产品，整个行业就是“百模大战”，我们的眼睛也是目不暇接，那究竟哪些模型最好用呢?
ChatGPT在线
29评论
9.11和9.9哪个大？AI翻车！好多网友竟也争论不休……
没想到，一道小学生难度的数学题，竟然难倒了一众海内外AI大模型。9.11和9.9哪个更大？
光明网
9.11比9.9大？多个大模型翻车！业内人士：就是偏科，文科强理科弱
近日，在新一期的《歌手》节目中，孙楠与外国歌手的微小分数差异，引发了网友关于13.8%和13.11%谁大谁小的争论。有网友竟给出“13.11%大于13.8%”的错误答案。当时就有网友提出，自己不会的话，“实在不行问问AI呢”？结果显示，不少AI还真的不行。第一财经记者拿“9.
天眼新闻
翻车了！9.11和9.9哪个大？记者实测12个大模型8个都答错
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大？
上观新闻
翻车了!9.11和9.9哪个大？记者实测12个大模型8个都答错
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大？
第一财经
9评论

加载更多

视频

在线举报