这里看到iLya一时冲动后OpenAI内核团队的变化,也是对6大方向人才的一点点尊重,iLya不是不优秀,尤其在坚持Transformer架构采用上是有独门绝技的,但像GPT-4这样的复杂MOE架构产品,一个人再强也得靠团队的支撑。
5月9日,中文通用大模型综合性评测基准SuperCLUE正式发布。该基准测试主要关注以下问题:中文大模型在不同任务上的表现如何?与国际代表性模型相比,中文大模型的表现达到了何种程度?中文大模型与人类表现相比如何?
·国内大模型相比GPT-4还存在差距,推理、数学、代码、智能体是国内大模型短板,中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名(采用百分制)。商用闭源模型通过API形式测试,开源模型直接在模型权重上测试。