1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。该公司称,MiniMax-01系列模型首次大规模实现线性注意力机制,传统Transformer架构不再是唯一的选择。
1月15日,澎湃科技(www.thepaper.cn)获悉,AI独角兽企业MiniMax上海稀宇科技有限公司(以下简称“MiniMax”)发布并开源新一代01全新系列模型。该系列模型包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。
【MiniMax发布并开源新一代01系列模型】《科创板日报》15日讯,MiniMax发布并开源新一代01系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。
资料来源:MiniMax 官网1月15日,上海基础大模型企业上海稀宇科技有限公司(以下简称“MiniMax”)正式发布了全新MiniMax-01系列模型,并开源了MiniMax-o1系列两个模型的完整权重,以促进技术创新、加速应用落地、实现开放合作、弥合智能鸿沟。
在2025全球开发者先锋大会(GDC)上,申城AI企业稀宇科技(MiniMax)以“开源共生”为主题,举办多模态大模型生态发展论坛。论坛中,MiniMax与学界、业界专家以及全球开发者社区代表、AI创作者代表,共同探讨人工智能的前沿技术、应用场景与未来趋势。
一、模型核心能力1. 超长上下文处理- 400万token输入窗口:MiniMax-Text-01是全球首个支持400万token上下文的开源模型,是GPT-4o的32倍、Claude-3.5-Sonnet的20倍。
21世纪经济报道记者白杨 北京报道2025年的第一个月,国产大模型在开源社区“热了”起来。几天前,MiniMax发布并开源了全新系列模型MiniMax-01,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。
想站稳脚跟,不能走捷径。在大模型“撞墙论”不绝于耳的当下,行业比任何时候都更为迫切地渴求探索、渴求创新。步入2025年这短短一个月之内,全球大模型玩家仿佛集体“冲业绩”,OpenAI、谷歌、DeepSeek等玩家密集发布了一系列新品。
本文针对国内外主流AI大模型的特点、优劣势及最新进展进行梳理。本文针对国内外主流AI大模型的特点、优劣势及最新进展进行梳理,包括OpenAI GPT-4、o3-mini、Sora、Googel Gemini 2.0、Anthropic Claude 3.5、xAI Grok-2、Meta Llama 3.3、Mistral AI Le Chat、Deepseek R1/V3、阿里Qwen2.5、字节豆包1.5Pro、腾讯混元、百度文心4.0、讯飞星火、月之暗面Kimi、智谱GLM-4、昆仑万维天工4.0、百川智能Baichuan系列、MiniMax01系列、零一万物Yi系列、阶跃星辰Step系列,把握AI大模型的发展趋势。
算算,深度求索公司DeepSeek发布大招,已经过去30天了。“DeepSeek-R1性能对标OpenAI o1正式版+开源模型权重+网页版和App免费可用+API每百万tokens输入只要1块钱+论文训练技术全部公开”,1月20日的这套“组合拳”下来,全球大模型产业巨震。
不论怎么看,AI都早已不是新词,但在当下,风头最盛。像在一个微波炉里温了许久,忽地在这个蛇年,炉子发出了那“叮——”的一声。2025年3月3日、4日,全国政协、全国人大先后举行新闻发布会,人形机器人上“春晚”、人工智能开源大模型、一批中国公司在人工智能领域崛起,都成为热议话题。