chatbot arena榜单

资讯

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首
机器之心报道编辑：佳琪、蛋酱就在国内各家大模型厂商趁年底疯狂卷的时候，太平洋的另一端也没闲着。就在今天，谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版，并再次登顶 Chatbot Arena 排行榜。
机器之心Pro
1评论
国内国际双榜单亮剑，腾讯混元大模型如何定义“全能AI”？
腾讯混元大模型近期在国内外两大权威评测中交出了“双优答卷”，成为中文AI领域的技术标杆。
封面新闻
5评论
爆发了！阿里巴巴突传消息
据界面新闻，2月12日上午，港股阿里巴巴涨超5%。消息方面，苹果和阿里巴巴据称将合作为中国iPhone用户开发AI功能。据中国基金报，今年春节期间，阿里云发布通义千问旗舰版模型Qwen2.5-Max。
鲁中晨报
15评论
超DeepSeek V3！阿里云Qwen2.5-Max闯入全球盲测榜单前十
2月4日凌晨，三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单，一周前刚发布的Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型，以1332分位列全球第七名，也是非推理类的中国大模型冠军。
21世纪经济报道
79评论
中文大模型竞技场来了！阿里百度腾讯等20款国产大模型“蒙面PK”
近日，上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena，首度集齐国内主流大模型全阵容，阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱AI、百川智能、零一万物、月之暗面、Minimax、深度求索、书生·浦语等20款国产大模型出战，角逐中国大模型“最强王者”。
新民晚报
1评论
马斯克宣称“最聪明的AI”来了！消耗20万块GPU，“又好又贵”
北京时间今天中午12点，埃隆·马斯克宣布旗下人工智能（AI）公司xAI研发的新一代AI模型Grok 3正式发布。
上观新闻
1评论
对OpenAI发起直接挑战，DeepSeek“杀入”文生图领域
在用V3和R1模型横扫硅谷、引爆全球科技圈后，DeepSeek在除夕这天继续放大招。
第一财经
26评论
马斯克推出“地球上最聪明的人工智能”Grok 3，发布会有啥亮点？
千呼万唤始出来，美国当地时间17日晚间（北京时间18日中午），马斯克旗下人工智能初创公司xAI终于发布了新一代聊天机器人Grok 3。舆论认为，总计40分钟左右的发布会，不仅展现了Grok 3的强大计算能力和推理能力，还凸显了马斯克在人工智能领域的宏大野心。
上观新闻
8评论
创造历史，阿里通义开源模型Qwen2.5进入大模型盲测全球前十
9月29日消息，基准测试平台Chatbot Arena日前公布最新大模型盲测榜单，10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强，其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十，是前十唯一的中国大模型;
钱江晚报
2评论
DeepSeek推动巨头加速AI竞赛：OpenAI之后，谷歌AI大模型全面上新
DeepSeek的横空出世推动海外AI（人工智能）巨头加速上新。当地时间2月5日，谷歌旗下AI大模型Gemini系列全面上新，包括正式版Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.
澎湃新闻
2评论
OpenAI大动作，谋划开源！CEO在线征集方案
每经编辑：毕陆名2月18日，OpenAI首席执行官萨姆·奥尔特曼在X平台发文称:“对于我们的下一个开源项目，我们应当选择开发一个虽然体积小但仍然需要借助GPU运行的o3 mini层级模型，还是应当致力于开发一个尺寸适合手机且表现最佳的模型呢？
每日经济新闻
（经济观察）中国大模型密集“上新” 中美科技股价值有望重估
来源：中国新闻网中新社北京2月6日电 (记者夏宾)乙巳蛇年，中国大模型密集“上新”，引发各方关注。一边是阿里云旗下大模型全新版本升级发布。1月29日凌晨，阿里云通义团队发布的Qwen2.
环球网
字节、阿里开卷大模型价格战，百度“火上浇油”，创业公司怎么办？李开复表态
每经记者：赵雯琪每经编辑：刘雪梅李开复露面的频率越来越高，都是因为大模型。没有上周发布会上精致讲究的穿搭和标志性的领带，这次李开复只是一件西服配上衬衫就出现在摄像头前，显得有些仓促。“昨晚技术团队看到这个突破很激动，我们就迫不及待想在今天和大家分享了。
每日经济新闻
全球最新排名：DeepSeek-V3夺开源模型第一！是“新瓶装旧酒”还是实质性突破？业内人士详解
每经记者：郑雨航每经实习记者：岳楚鹏每经编辑：高涵2024年12月26日，深度求索（DeepSeek）发布了其最新人工智能（AI）大模型DeepSeek-V3，并同步开源，刷屏中外AI圈。
每日经济新闻
105评论

加载更多

视频

在线举报