上海人工智能实验室今天公布了多名“AI考生”参加今年中国高考的成绩,阿里Qwen2-72B、GPT-4o和“书生·浦语”2.0文曲星(InternLM2-20B-WQX)成为三甲,得分率均超过70%。大部分“AI考生”在语文、英语科目上表现良好,但数学成绩不如人意。
上海人工智能实验室今天公布了多名“AI考生”参加今年中国高考的成绩,阿里Qwen2-72B、GPT-4o和“书生·浦语”2.0文曲星(InternLM2-20B-WQX)成为三甲,得分率均超过70%。大部分“AI考生”在语文、英语科目上表现良好,但数学成绩不如人意。
·大部分大模型“考生”语文、英语科目表现良好,但在数学方面还有待加强。阅卷老师点评,在语文科目上,对于语言中的一些“潜台词”,大模型尚无法完全理解。在数学科目上,大模型的主观题回答相对凌乱,且过程具有迷惑性。6月19日,首个大模型高考全卷评测结果公布。
极目新闻记者 周丹实习生 贺怡萍 魏文婧6月19日,上海人工智能实验室发布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,高于OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.
最近两年,ChatGPT的火热催生了一大批AI大模型,让大家对于生成式AI的能力,可谓是又惊讶又担心,引发大家的担忧,担心自己的工作、技能会被AI取代!而高考这样的知识性的测验,就很适合AI大模型去做测试,如果用AI来代替学生去高考,会怎么样?
人工智能大模型参加中国高考,可以得几分?近日,大模型开源开放评测体系“司南”(OpenCompass)对中外7个人工智能大模型进行了今年高考(新课标卷)全科目测试,结果显示:上海人工智能实验室“书生·浦语2.
光明网评论员:大模型作答高考卷,一个有意思的实验: 2024年全国高考结束后,上海人工智能实验室的司南评测体系(Open Compass)选取了包括GPT-4o在内的中外6个开源模型,针对高考全国新课标I卷“语数外”三门课程进行了全卷能力测试。
◎记者 杨 雪大模型参加高考,能考多少分?近日,科技创新交流平台极客公园发布高考新课标Ⅰ卷大模型评测报告,在参试大模型中,GPT-4o以562分的成绩排名文科第一。参加评测的8款国产大模型中,字节跳动旗下的豆包成绩是542.5分,其后依次是百度文心一言4.0的537.
光明网评论员:大模型作答高考卷,一个有意思的实验: 2024年全国高考结束后,上海人工智能实验室的司南评测体系(Open Compass)选取了包括GPT-4o在内的中外6个开源模型,针对高考全国新课标I卷“语数外”三门课程进行了全卷能力测试。
N海都全媒体记者 齐榕6月30日,福建高考志愿正式开始填报。俗话说“七分考,三分报”。高考分数出炉后,家长和考生们纷纷着手研究、规划高考志愿填报。近日,有家长向记者反馈,目前市面上有多款“AI志愿填报”工具,或收费或免费,让人“眼花缭乱”,针对此事,记者进行了一番调查。
□王金玉 (青岛大学)6月24日,高考新课标Ⅰ卷全科目大模型评测报告出炉。数据显示,GPT-4o 以562分排名文科总分第一,字节跳动旗下的豆包成绩是542.5分,排名国产AI首位,其后依次是百度文心一言4.0的537.5分,以及百川智能“百小应”的521分。
大河报·豫视频记者 周斌 6月24日,高考新课标Ⅰ卷全科目大模型评测报告出炉。数据显示,GPT-4o 以562分排名文科总分第一,字节跳动旗下的豆包成绩是542.5分,排名国产AI首位,其后依次是百度文心一言4.0的537.5分,以及百川智能“百小应”的521分。
提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问AI奇点网-AI资讯特刊丨6月20日6月19日,上海人工智能实验室和司南评测体系发布了国内首个针对AI大模型参与2024高考「语数英」三科目的全卷解题能力测试的结果。
6月7日数学高考当天,学霸君推出其自主研发四年的智能教育机器人Aidam,并完成了一次和数名数学高考状元的同台PK,解答2017年高考数学题。经过一轮紧张角逐,最终,Aidam获得134分的总分。根据现场统计显示,高考状元组的成绩平均分别为119分、140分和146分。