来源/采访对象提供新民晚报讯(记者金志刚)近日,复旦大学自然语言处理(NLP)实验室LLMEVAL团队公布了2024年高考数学大模型评测结果。数据显示,字节豆包在2024高考数学新II卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二三位。
每经编辑:吴永久春节的脚步声越来越近,目前节前只有4个交易日了,下周一是节前最后一个交易日。周二,科技股表现亮眼,科创50指数上涨0.83%,人形机器人、SOC芯片、物联网模组、CPO交换机等板块涨幅居前。
6月中旬,智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单:在有标准答案的“客观评测”中,GPT-4 以76.11分在闭源大模型中排名第一;Doubao-Pro(豆包大模型)以75.96分排名第二,同时也是得分最高的国产大模型;其后依次是 ERNIE 4.
“豆包主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。”5月15日,在火山引擎FORCE原动力大会上,火山引擎总裁谭待宣布,字节跳动自主研发的豆包大模型将通过火山引擎正式对外提供服务。
6月19日,潇湘晨报记者获悉,近日智源研究院旗下的FlagEval大模型评测平台发布最新榜单:在有标准答案的“客观评测”中,GPT-4以76.11分在闭源大模型中排名第一;Doubao-Pro(豆包大模型)以75.
近日,有媒体报道称,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。对此,有知情人士透露,有加强大模型相关研究的长期计划,但并未决定建立独立的机构;黄文灏负责技术项目管理和规划,汇报给朱文佳。据了解,黄文灏曾担任零一万物的算法副总裁。
大河报·豫视频记者 周斌 6月24日,高考新课标Ⅰ卷全科目大模型评测报告出炉。数据显示,GPT-4o 以562分排名文科总分第一,字节跳动旗下的豆包成绩是542.5分,排名国产AI首位,其后依次是百度文心一言4.0的537.5分,以及百川智能“百小应”的521分。
5月17日,北京新型研发机构智源研究院举办大模型评测发布会,发布并解读了对国内外140余个开源和商业闭源的语言及多模态大模型的能力评测结果。此次测评首次引入人类学生熟悉的学科测试,让AI考生和三年级到高三学段的人类考生平均水平一较高下。
每经记者:叶晓丹 每经编辑:梁枭今日(5月21日),阿里云方面宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。
□王金玉 (青岛大学)6月24日,高考新课标Ⅰ卷全科目大模型评测报告出炉。数据显示,GPT-4o 以562分排名文科总分第一,字节跳动旗下的豆包成绩是542.5分,排名国产AI首位,其后依次是百度文心一言4.0的537.5分,以及百川智能“百小应”的521分。
豆包即将发布最新实时语音大模型,并将基于此模型全量上线豆包App实时语音通话功能。目前,豆包APP已小范围测试最新能力,部分用户在豆包App的实时通话界面已更新。此前,业内就曾有消息称豆包将上线最新情感语音大模型,测试效果超过GPT-4o。