宝兰德2月5日在互动平台表示,公司相关产品目前已接入DeepSeek、QWen、ChatGLM、文心一言等通用大模型且已有成功案例,助力行业用户打造面向垂直领域的AI Agent应用,同时针对底层算力也已适配基于昇腾系列NPU卡,能够充分调度、使用昇腾NPU算力进行训练和提供推理
近日,有消息称,华裔科学家、“AI教母”李飞飞的团队研究人员以不到50美元的费用训练了一个能力比肩DeepSeek-R1的s1模型。记者从相关人士处了解到,这个s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。
1月28日,阿里云通义开源视觉模型Qwen2.5-VL,共推出3B、7B和72B三个尺寸版本。据介绍,Qwen2.5-VL不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。旗舰版Qwen2.
9月29日消息,基准测试平台Chatbot Arena日前公布最新大模型盲测榜单,10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十,是前十唯一的中国大模型;
新京报贝壳财经讯(记者罗亦丹)1月28日,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本,并已在魔搭社区、HuggingFace等平台开源。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中的得分领先GPT-4o与Claude3.