“苟日新,日日新,又日新”,国产大模型正在疾速前进。最近,一款叫“日日新”的大模型风头正盛。几天前,国内权威大模型测评机构SuperCLUE榜单出炉,商汤“日日新5.0”(SenseChat V5)的中文基准测评结果排名第一,以总分80.
来源:环球网 【环球网科技综合报道】科大讯飞副总裁兼研究院院长刘聪,在博鳌2024年会中宣布了一项重磅消息:科大讯飞将在今年六月正式发布星火大模型的全新版本V4.0。据悉,此次升级后的模型将对标当前业界领先的GPT-4(Turbo)的能力。
·国内大模型相比GPT-4还存在差距,推理、数学、代码、智能体是国内大模型短板,中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名(采用百分制)。商用闭源模型通过API形式测试,开源模型直接在模型权重上测试。