潮新闻客户端 记者 张云山9月19日云栖大会,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.
据阿里通义千问消息,3月29日,通义千问团队开源首个MoE模型,名为Qwen1.5-MoE-A2.7B。它仅有27亿个激活参数,但性能可与当前公认最先进的70亿参数模型(Mistral7B、Qwen1.5-7B等)相媲美。
作者 | 香草编辑 | 李水青智东西12月1日报道,今日,阿里云在北京举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B,并同步开源了通义千问18亿参数模型Qwen-1.8B和通义千问音频大模型Qwen-Audio。
12月1日,阿里云宣布开源通义千问720亿参数模型Qwen-72B。Qwen-72B在10个权威基准测评创下开源模型最优成绩,性能超越开源标杆Llama 2-70B和大部分商用闭源模型。未来,企业级、科研级的高性能应用,也有了开源大模型这一选项。
潮新闻客户端 记者 张云山11月28日,阿里云通义团队发布全新AI推理模型QwQ-32B-Preview,并同步开源。评测数据显示,预览版本的QwQ,已展现出研究生水平的科学推理能力,在数学和编程方面表现尤为出色,整体推理水平比肩OpenAI o1。
三天前,马云满面荣光地出现在阿里园区,热情地和阿里的年轻人打招呼、合影,看起来气色和心情都不错。敏锐的网友发问:有大事发生?当天晚上,一条传言在科技圈炸开了锅:阿里和苹果将联手,为中国版的iPhone开发人工智能功能。
近日,超大规模的 MoE 模型(混合专家模型)通义千问 Qwen2.5-Max 正式上线,通义千问团队使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。通义千问团队表示,“今天,我们很高兴能给大家分享 Qwen2.5-Max 目前所取得的成果。