2月4日凌晨,Chatbot Arena LLM Leaderboard更新了最新一期的榜单,不久前发布的Qwen2.5-Max直接冲进前十,超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名!同时,Qwen2.
故事起因是这样的:10天前,大家都准备回家过年了,结果来自浙江的一家小公司DeepSeek火了,它发布的V3模型,震惊了美国AI圈和金融圈,还上了新闻联播,一夜之间和华为、阿里比肩齐名了,搞的扎克伯格一度呼吁美国加紧封锁中国AI技术。
2月4日凌晨,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,一周前刚发布的Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,也是非推理类的中国大模型冠军。
西风 梦晨 发自 凹非寺量子位 | 公众号 QbitAI昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。