近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.
图说:不同大模型回答“13.8和13.11哪个大?”13.8和13.11哪个大? 综艺节目的选手排名,竟让一道本不该成为争议的“小学数学题”,在网上掀起讨论。 不仅部分人类搞不清楚,“聪明”的大模型也洋相百出——简单的常识题对它们来说还是有难度!
近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.
当地时间5月30日,瑞士日内瓦,在国际电信联盟(ITU)“人工智能造福人类全球峰会”期间,一台人工智能的机器人在展台上展示。视觉中国供图无论是否关注,AI都正在深入我们的生活。一年多以前,人们还惊异于ChatGPT的横空出世,如今,许多人已习惯于在工作生活中寻求人工智能的辅助。
近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.
近年来,生成式预训练模型的兴起彻底颠覆了自然语言处理领域,其影响甚至已经延伸到其他多种模态。然而,像 ChatGPT 和 GPT-4 这样的模型,由于其巨大的模型规模与计算复杂度、复杂的部署方式以及未开源的训练模型,这些因素都限制了他们在学术界和工业界的推广与应用。
13.11和13.8谁大?——这样一道简单的“小升初”数学题难倒一众网友和大模型。“13.8 13.11”已经成为网络新热梗。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。
9月13日,OpenAI发布新模型o1,此前被网友诟病的大模型比较不出9.11和9.9大小的问题,终于在新版大模型中得到了正确结论。 经过测试,o1-preview依旧给出错误答案,认为9.11更大。而o1-mini经过短暂“思考”,纠正了此前错误:“抱歉,上次的回答有误。9.
近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.
近日,在新一期的《歌手》节目中,孙楠与外国歌手的微小分数差异,引发了网友关于13.8%和13.11%谁大谁小的争论。有网友竟给出“13.11%大于13.8%”的错误答案。当时就有网友提出,自己不会的话,“实在不行问问AI呢”?结果显示,不少AI还真的不行。第一财经记者拿“9.