来源/采访对象提供新民晚报讯(记者金志刚)近日,复旦大学自然语言处理(NLP)实验室LLMEVAL团队公布了2024年高考数学大模型评测结果。数据显示,字节豆包在2024高考数学新II卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二三位。
6月中旬,智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单:在有标准答案的“客观评测”中,GPT-4 以76.11分在闭源大模型中排名第一;Doubao-Pro(豆包大模型)以75.96分排名第二,同时也是得分最高的国产大模型;其后依次是 ERNIE 4.
6月19日,潇湘晨报记者获悉,近日智源研究院旗下的FlagEval大模型评测平台发布最新榜单:在有标准答案的“客观评测”中,GPT-4以76.11分在闭源大模型中排名第一;Doubao-Pro(豆包大模型)以75.