3月6日凌晨,阿里发布并开源全新的推理模型通义千问QwQ-32B。据了解,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美,但二者在参数量上相差将近20倍。
编者按连日来,中国人工智能企业深度求索DeepSeek推出的开源大模型,凭借性能优越、免费商用、训练成本低等优势,在全球引发高度关注。这一成果不仅为我国人工智能领域注入新活力,也激发了更多业内专业人士的思考。
来源:中国青年报 2025全球开发者先锋大会正在上海举行,一批国内外头部人工智能企业发布了多项重磅技术与解决方案,共同探讨人工智能产业的发展之路。作为人工智能领域中一个重要技术和应用分支,大模型的发展成为本次大会的热门话题。国产大模型有哪些发展新趋势?记者就此采访了多位业内人士。
本周开始,DeepSeek正式开启“开源周”,每天开源一个项目,再度引发全球大模型的开源潮。记者注意到,与此前推理模型的开源不同,这几天,全球大模型在多模态领域“卷”了起来,国产大模型还表现出超越Sora的能力。25日晚10点,阿里云宣布视觉生成基座模型万相2.
来源:【爱济南新闻客户端】近日,量化巨头幻方量化的子公司深度求索(DeepSeek)发布了全新系列模型DeepSeek-V3,并同步开源。这一事件迅速引爆AI圈,DeepSeek-V3不仅霸榜开源模型,更在性能上与全球顶尖闭源模型GPT-4o和Claude-3.
极目新闻记者 赵鹏姝通讯员 李炎哲国产开源大模型DeepSeek火速“出圈”,成为关注焦点。2月18日,武汉云基于华为昇腾910B,成功部署上线deepseek-R1(671B版),为武汉市市区两级政务用户提供快速访问服务。
2月23日,清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,实现了安全性的显著提升,表现优于被认为安全性较好的闭源大模型Claude3.