qwen微调

资讯

开源VS闭源：大模型发展路在何方
北京时间9月19日凌晨阿里巴巴史上最大规模的开源发布包含基础模型Qwen2.5用于编码的Qwen2.5-Coder和用于数学的Qwen2.5-Math刷新业界纪录引发关注图源：Qwen X平台截图Qwen2.5有何不同Qwen2.
光明网
阿里云开源通义千问14B模型，想把AI社区生态先建起来
9月25日，阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat，免费可商用。用户可从魔搭社区直接下载模型，也可通过阿里云灵积平台访问和调用。
第一财经
阿里云通义开源最强过程奖励PRM模型，7B尺寸比GPT-4o更能发现推理错误
潮新闻客户端记者张云山1月16日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型；在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。
钱江晚报
DeepSeek重塑AI、云计算 “卖水人”迎来价值重构？
《科创板日报》2月9日讯（编辑宋子乔）DeepSeek的热度跨越春节，而A股投资者对DeepSeek概念股的追逐，逐渐从股权投资方、应用端，扩展到云计算这一“卖水人”环节。春节后的A股三个交易日里，作为第三方云计算厂商的优刻得和青云科技连收三个一字板。
财联社
1评论
阿里云开源模型Qwen2-72B发布：性能提升明显，提供多语言支持
来源：环球网【环球网科技报道记者李文瑶】6月7日，阿里云更新技术博客，宣布发布开源模型Qwen2-72B。所有人均可在魔搭社区和Hugging Face免费下载通义千问最新开源模型。相比2月推出的通义千问Qwen1.5，Qwen2实现了整体性能的代际飞跃。
环球网
2评论

视频

在线举报