关于“9.11和9.9哪个大”,这样一道小学生难度的数学题难倒了一众海内外AI大模型。7月17日,第一财经报道了国内外“12个大模型8个都会答错”这道题的现象,大模型的数学能力引发讨论。“从技术人员的角度看答错这个问题并不惊讶。
作者 | 香草编辑 | 李水青降价、免费,立即生效!智东西5月27日报道,618的风还是吹到了AI界。最近几天,大模型厂商近乎疯狂地打起了价格战,这边阿里云刚宣布降价97%,那边百度就宣布两款模型全面免费,好不热闹!
今天就来看看,国内各具代表性的四家大模型公司,到底谁才是国产大模型的老大。拓尔思,优势:公司一直专注中文全文检索、自然语言处理技术的自主研发与应用创新,拥有各类专利 60 余项, 软件著作权 800 余项,是国内最早从事 NLP 研发的企业之一。
9月13日,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放。8月31日,11家大模型正式通过备案。目前已有包括百度文心一言、智谱AI智谱清言、科大讯飞星火大模型、商汤商量、百川大模型(53B)、MINIMAX、360智脑以及抖音豆包等多款大模型,开放用户服务。
·国内大模型相比GPT-4还存在差距,推理、数学、代码、智能体是国内大模型短板,中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名(采用百分制)。商用闭源模型通过API形式测试,开源模型直接在模型权重上测试。