新京报贝壳财经讯(记者罗亦丹)北京时间3月6日凌晨,通义千问在官方公号上发文称,推出最新的推理模型 QwQ-32B。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的 DeepSeek-R1媲美。通义千问表示,强化学习可以显著提高模型的推理能力。
潮新闻客户端 记者 张云山9月19日云栖大会,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.
5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。相比通义千问2.1版本,通义千问2.
潮新闻客户端 记者 张云山4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型,并在多项基准测评中都创下可与Llama3-70B媲美的成绩。目前Qwen1.5系列已累计开源10款大模型,通义千问开源模型下载量超过700万。
潮新闻客户端 记者 张云山9月19日云栖大会,阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。
潮新闻客户端 记者 张云山5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。
阿里巴巴旗下阿里云昨日发布并开源全新推理模型“通义千问QwQ-32B”,称其“整体性能比肩DeepSeek-R1”,加上中国证监会主席吴清在昨日的经济主题记者会上指出,DeepSeek带动了中国资产价值重估,系列消息引发阿里巴巴股价大升8.39%,港股亦连续两日大升,昨日升775点,科指飙5.4%。
6月20日消息,斯坦福大学的大模型测评榜单HELM MMLU发布最新结果,斯坦福大学基础模型研究中心主任Percy Liang发文表示,阿里通义千问Qwen2-72B模型成为排名最高的开源大模型,性能超越Llama3-70B模型。