机器之心报道编辑:佳琪、蛋酱就在国内各家大模型厂商趁年底疯狂卷的时候,太平洋的另一端也没闲着。就在今天,谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版,并再次登顶 Chatbot Arena 排行榜。
2月4日凌晨,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,一周前刚发布的Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,也是非推理类的中国大模型冠军。
近日,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱AI、百川智能、零一万物、月之暗面、Minimax、深度求索、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。
千呼万唤始出来,美国当地时间17日晚间(北京时间18日中午),马斯克旗下人工智能初创公司xAI终于发布了新一代聊天机器人Grok 3。舆论认为,总计40分钟左右的发布会,不仅展现了Grok 3的强大计算能力和推理能力,还凸显了马斯克在人工智能领域的宏大野心。
9月29日消息,基准测试平台Chatbot Arena日前公布最新大模型盲测榜单,10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十,是前十唯一的中国大模型;
DeepSeek的横空出世推动海外AI(人工智能)巨头加速上新。当地时间2月5日,谷歌旗下AI大模型Gemini系列全面上新,包括正式版Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.
每经编辑:毕陆名2月18日,OpenAI首席执行官萨姆·奥尔特曼在X平台发文称:“对于我们的下一个开源项目,我们应当选择开发一个虽然体积小但仍然需要借助GPU运行的o3 mini层级模型,还是应当致力于开发一个尺寸适合手机且表现最佳的模型呢?
每经记者:赵雯琪 每经编辑:刘雪梅李开复露面的频率越来越高,都是因为大模型。没有上周发布会上精致讲究的穿搭和标志性的领带,这次李开复只是一件西服配上衬衫就出现在摄像头前,显得有些仓促。“昨晚技术团队看到这个突破很激动,我们就迫不及待想在今天和大家分享了。