国产开源大模型

资讯

国产开源大模型，重磅发布！
3月6日凌晨，阿里发布并开源全新的推理模型通义千问QwQ-32B。据了解，这是一款拥有320亿参数的模型，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1媲美，但二者在参数量上相差将近20倍。
每日经济新闻
3评论
输入长度是GPT-4o的32倍，国产开源大模型突破瓶颈，迎接智能体时代
今天，上海稀宇科技公司（MiniMax）发布并开源了新一代01系列人工智能模型，包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。
上观新闻
17评论
对话全国政协委员、九三学社中央委员、360集团创始人周鸿祎：国产开源大模型如何重塑AI格局
编者按连日来，中国人工智能企业深度求索DeepSeek推出的开源大模型，凭借性能优越、免费商用、训练成本低等优势，在全球引发高度关注。这一成果不仅为我国人工智能领域注入新活力，也激发了更多业内专业人士的思考。
团结报党派e家
1评论
国产大模型DeepSeek V3，以开源的形态现世
DeepSeek V3的训练成本相对较低，使用英伟达H800 GPU在短短两个月内就训练完成，仅花费了约558万美元。
Ai探索小白
15评论
国产大模型又有重磅！阿里发布通义千问旗舰版模型，采用开源策略
红星资本局1月30日消息，据“阿里云”微信公众号，1月29日凌晨，阿里云通义千问旗舰版模型Qwen2.5-Max全新升级发布。据介绍，Qwen2.
齐鲁壹点
4评论
国产大模型加速迭代开源渐成“必选项”
来源：中国青年报 2025全球开发者先锋大会正在上海举行，一批国内外头部人工智能企业发布了多项重磅技术与解决方案，共同探讨人工智能产业的发展之路。作为人工智能领域中一个重要技术和应用分支，大模型的发展成为本次大会的热门话题。国产大模型有哪些发展新趋势？记者就此采访了多位业内人士。
环球网
多模态跟着DeepSeek一起“卷”，开源国产大模型性能超越Sora
本周开始，DeepSeek正式开启“开源周”，每天开源一个项目，再度引发全球大模型的开源潮。记者注意到，与此前推理模型的开源不同，这几天，全球大模型在多模态领域“卷”了起来，国产大模型还表现出超越Sora的能力。25日晚10点，阿里云宣布视觉生成基座模型万相2.
上观新闻
88评论
让科学家们兴奋不已？中国国产AI大模型受全球追捧
来源：中央广电总台国际在线编辑：韩基韬国际在线专稿：近日，中国人工智能（AI）企业DeepSeek发布R1模型，该模型各方面表现亮眼，迅速引起国际社会广泛关注与讨论。
国际在线
20评论
国产大模型刷屏海外！美国网友直接破大防，日本网友改口
不同于其他的玩家，通义千问直接走的是“全模态、全尺寸”开源的路线，从Qwen1.5到Qwen2.5，提升的大模型的技术水平，而不变的则是海外网友对国产大模型的追捧。
文史颜如玉
9评论
接力DeepSeek，阶跃星辰直接开源两款国产多模态大模型
机器之心报道作者：泽南两款 Step 系列开源多模态大模型，性能位列开源多模态全行业第一。本周二，国内 AI 创业公司阶跃星辰和吉利汽车集团宣布联合开源两款多模态大模型。
机器之心Pro
1评论
国产AI大模型DeepSeek冲破封锁全球刷屏，成本仅为GPT的1/20
来源：【爱济南新闻客户端】近日，量化巨头幻方量化的子公司深度求索（DeepSeek）发布了全新系列模型DeepSeek-V3，并同步开源。这一事件迅速引爆AI圈，DeepSeek-V3不仅霸榜开源模型，更在性能上与全球顶尖闭源模型GPT-4o和Claude-3.
全国党媒信息公共平台
7评论
武汉云上线“满血版”DeepSeek-R1模型
极目新闻记者赵鹏姝通讯员李炎哲国产开源大模型DeepSeek火速“出圈”，成为关注焦点。2月18日，武汉云基于华为昇腾910B，成功部署上线deepseek-R1（671B版），为武汉市市区两级政务用户提供快速访问服务。
极目新闻
“增强版DeepSeek”来了！清华瑞莱联合团队推出RealSafe-R1大模型
2月23日，清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练，在确保性能稳定的基础上，实现了安全性的显著提升，表现优于被认为安全性较好的闭源大模型Claude3.
北青网

加载更多

视频