大模型排行榜

资讯

烧了 300 张 H100，新版开源 LLM 排行榜发布：中国模型 Qwen-72B 仍是第一！
由 CSDN 和 Boolan 联合主办的「2024 全球软件研发技术大会」将于 7 月 4 -5 日在北京威斯汀酒店举行。
CSDN
10评论
2024-06-28
厦大教授团队自主研发大模型“霸榜”权威榜单！看国产“优等生”是怎样炼成的→
纪荣嵘教授（右二）指导学生开展科研活动。（受访者供图）　　多份大模型领域的权威榜单，让低调的厦门产大模型——思源大模型浮出水面。
厦门日报
0评论
2024-08-30
中国信通院医疗健康大模型效能评估结果出炉，讯飞星火医疗大模型四大能力排名第一
中新经纬10月17日电近期，中国信通院对包括GPT-4Turbo、GPT-4O等国际通用大模型，文心一言、通义千问、混元和智谱清言ChatGLM等国内通用大模型，以及灵医Bot、夸克健康助手、讯飞星火医疗大模型和华佗GPT II等医疗健康行业大模型进行了效能评估。
中新经纬
3评论
2024-10-17
最新中文大模型测评：百川、智谱、通义领跑国内
4月30日，国内权威大模型评测机构SuperCLUE发布了《中文大模型基准测评2024年度4月报告》，报告选取国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，对国内外大模型发展现状进行观察与思考。
北京日报客户端
26评论
2024-04-30
重磅！“大模型可信能力评测排行榜”全国首发
近日，“大湾区生成式人工智能安全发展联合实验室”全国首发“大模型可信能力评测排行榜”，阿里巴巴“Qwen2-72b”、百度“Ernie-4.0”等一批知名企业的大模型上榜。国内首家落地对标《人工智能安全治理框架》1.
南方新闻网
9评论
2024-09-29
首个AI高考全卷评测结果发布，这个大模型排名第一
极目新闻记者周丹实习生贺怡萍魏文婧6月19日，上海人工智能实验室发布首个AI高考全卷评测结果，月初开源的阿里通义千问大模型Qwen2-72B排名第一，在语数外三科420分的满分中获得303分，高于OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.
极目新闻
4评论
2024-06-20
大模型评测榜单发布：GPT-4第一，智谱、阿里、百度产品跻身前五
昨天，上海人工智能实验室发布了2023年度大模型评测榜单。经过大模型开源开放评测体系“司南”（OpenCompass2.
上观新闻
1评论
2024-01-31
大模型年度榜单公布：GPT-4第一，智谱、阿里紧追
·国内大模型相比GPT-4还存在差距，推理、数学、代码、智能体是国内大模型短板，中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名（采用百分制）。商用闭源模型通过API形式测试，开源模型直接在模型权重上测试。
澎湃新闻
2评论
2024-01-31
智源更新大模型排行榜：豆包大模型“客观评测”排名国产第一
6月中旬，智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单：在有标准答案的“客观评测”中，GPT-4 以76.11分在闭源大模型中排名第一；Doubao-Pro（豆包大模型）以75.96分排名第二，同时也是得分最高的国产大模型；其后依次是 ERNIE 4.
三秦都市报
1评论
2024-06-18
27岁华裔天才少年首发SEAL大模型排行榜！Claude 3 Opus数学封神
前段时间，由27岁的华裔创始人Alexandr Wang领导的Scale AI刚刚因为融资圈了一波关注。
新智元
5评论
2024-05-30
大模型排行榜出炉！第一名不是ChatGPT！
现在科技圈什么最火？当属大模型。如雨后春笋般冒出的大模型，每一个都在争做行业No.1，但你知道现在哪个大模型能力最强？哪个最受人喜欢吗？
黑马程序员
47评论
2024-06-04
LiveBench发布最新榜单：阶跃星辰Step-2位列中国大模型第一
【LiveBench发布最新榜单：阶跃星辰Step-2位列中国大模型第一】《科创板日报》19日讯，国际榜单 LiveBench 官网公布了最新的语言大模型测评结果，阶跃星辰自研的万亿参数语言大模型 Step-2 的技术表现位列中国基座大模型第一，成绩逼近 OpenAI 的 o1-
财联社
4评论
2024-11-19

视频

在线举报