阿里通义千问与DeepSeek均于昨日低调开源了两款新模型。阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B,DeepSeek则将此前热门的“基座模型”V3更新到0324版本,并官宣在魔搭社区上架开源。
阿里再度推进开源进程。3月6日,阿里凌晨发布并开源通义千问推理模型QwQ-32B。据悉,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,用更小参数实现整体性能比肩DeepSeek-R1,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。
新京报贝壳财经讯(记者罗亦丹)北京时间3月6日凌晨,通义千问在官方公号上发文称,推出最新的推理模型 QwQ-32B。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的 DeepSeek-R1媲美。通义千问表示,强化学习可以显著提高模型的推理能力。
每经AI快讯,3月6日凌晨,阿里云通义千问官微宣布发布并开源最新的推理模型QwQ-32B。据介绍,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。
2025年以来,全球AI 产业被一个名字刷屏了,那就是 DeepSeek。凭借“高性能、低成本、开源等”优势,不仅实现了AI技术突破,还大大加速了产业应用,在全球范围内掀起了一股热潮。据统计,在短短 18 天内,DeepSeek下载量达到惊人的 1600 万次!
南都记者关注到,2月10日全球最大AI开源社区Huggingface发布了最新的开源大模型榜单,其中排名前十的开源大模型,都基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。除此以外,近期阿里通义千问(Qwen)模型屡次崭露头角。
智东西2月25日报道,今天,阿里通义千问团队推出QwQ-Max-Preview深度思考模型,并支持联网搜索,展现出超强的通用能力,不仅现场锐评了最新的《哪吒2》电影,还能写代码、做数学题,并可以胜任创意写作、游戏开发等开放性任务。
来源:经济日报 原标题:开源模型加速构建智能生态如果让你说出今年人工智能领域最轰动的一件事情,那大部分人的答案应该是DeepSeek的横空出世。今年2月初,DeepSeek在140个国家和地区的应用市场下载排行榜同时登顶,并以开源策略充分展现其技术自信。
今年以来,中国大模型开源的消息一个接一个。阿里云通义千问从除夕夜开源全新的视觉模型Qwen2.5-VL,再到本月初发布并开源了全新推理模型QwQ-32B,在开源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。