大语言模型排行榜

资讯

智源评测出炉：豆包大语言模型排名第一，多模态能力获得三项第二
12月19日，智源研究院发布最新一期大模型综合及专项评测结果。
21世纪经济报道
0评论
2024-12-20
大模型年度榜单公布：GPT-4第一，智谱、阿里紧追
·国内大模型相比GPT-4还存在差距，推理、数学、代码、智能体是国内大模型短板，中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名（采用百分制）。商用闭源模型通过API形式测试，开源模型直接在模型权重上测试。
澎湃新闻
2评论
2024-01-31
李开复：大模型价格战是“双输”的打法
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪时隔一周，零一万物再次更新其千亿参数闭源大模型Yi-Large的动态，这次是榜单成绩。5月21日，零一万物表示，在LMSYS盲测竞技场最新排名中，Yi-Large总榜排名世界模型第7。
界面新闻
1评论
2024-05-21
商汤商量：获SuperCLUE 9月评测中文大模型总榜第一排名
中证网讯（记者王可）记者1月11日从商汤科技获悉，近日，中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单，商汤商量SenseChat 3.0位列中文大模型总榜排名第一。在新增的AI Agent（AI智能体）子榜中，SenseChat 3.
中国证券报
0评论
2024-01-11
创造历史，阿里通义开源模型Qwen2.5进入大模型盲测全球前十
9月29日消息，基准测试平台Chatbot Arena日前公布最新大模型盲测榜单，10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强，其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十，是前十唯一的中国大模型;
钱江晚报
3评论
2024-09-29
南科大荆炳义课题组发布34B Chat模型，具备超强多轮对话能力
来源：【深圳特区报】近日，南科大统计与数据科学系讲席教授、大数据创新中心荆炳义课题组和粤港澳大湾区数字经济研究院（IDEA）认知计算与自然语言中心（CCNL）联合发布开源34B通用Chat模型：SUS-Chat-34B，在由美国Hugging Face社区支持的、致力于追踪、排名
全国党媒信息公共平台
0评论
2024-04-17
重庆首个自研大语言模型“兆言”跻身全球前三
3月5日，上海交通大学重庆人工智能研究院(沪渝人工智能研究院)发布消息，SuperCLUE(中文大模型智能体评测基准)近日发布最新排名，该院自主研发的大语言模型“兆言”以总分66.
金台资讯
0评论
2024-03-08
智源更新大模型排行榜：豆包大模型“客观评测”排名国产第一
6月中旬，智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单：在有标准答案的“客观评测”中，GPT-4 以76.11分在闭源大模型中排名第一；Doubao-Pro（豆包大模型）以75.96分排名第二，同时也是得分最高的国产大模型；其后依次是 ERNIE 4.
三秦都市报
1评论
2024-06-18
大模型评测榜单发布：GPT-4第一，智谱、阿里、百度产品跻身前五
昨天，上海人工智能实验室发布了2023年度大模型评测榜单。经过大模型开源开放评测体系“司南”（OpenCompass2.
上观新闻
1评论
2024-01-31

视频

在线举报