1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。该公司称,MiniMax-01系列模型首次大规模实现线性注意力机制,传统Transformer架构不再是唯一的选择。
资料来源:MiniMax 官网1月15日,上海基础大模型企业上海稀宇科技有限公司(以下简称“MiniMax”)正式发布了全新MiniMax-01系列模型,并开源了MiniMax-o1系列两个模型的完整权重,以促进技术创新、加速应用落地、实现开放合作、弥合智能鸿沟。
1月15日,澎湃科技(www.thepaper.cn)获悉,AI独角兽企业MiniMax上海稀宇科技有限公司(以下简称“MiniMax”)发布并开源新一代01全新系列模型。该系列模型包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。
转载自:新民周刊上海人工智能产业规模已突破4000亿元,规模以上企业超350家。上海的AI宇宙正在加速壮大,更多激动人心的故事正在续写。DeepSeek的走红,如同一颗超新星爆发,释放出巨大能量,瞬间照亮了中国的AI星系。
随着DeepSeek的爆火引发各行各业的“大模型热潮”,连日来,包括三大电信运营商、“三桶油”等中企巨头,百度、腾讯、网易等互联网大厂,以及多地政务服务系统、高校、银行、手机厂商、车企等纷纷踊跃接入DeepSeek大模型,“打不过就加入”之类的戏谑说法在网上广为流传。
DeepSeek破圈后,其他大模型企业怎么看?2025全球开发者先锋大会(GDC)将于2月21日至23日在上海徐汇举办。2月17日下午,澎湃新闻记者前往人工智能企业商汤科技、大模型创业公司稀宇科技(以下简称MiniMax)探营,并与两家企业的相关负责人聊了聊。
21世纪经济报道记者白杨 北京报道2025年的第一个月,国产大模型在开源社区“热了”起来。几天前,MiniMax发布并开源了全新系列模型MiniMax-01,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。