来源:环球网 【环球网科技综合报道】8月24日消息,国内GPU与AI计算解决方案提供商摩尔线程宣布,正式开源了其音频理解大模型——MooER(摩耳)。据介绍,该模型是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型。
每经记者:杨卉 每经编辑:董兴生5月25日,《每日经济新闻》记者从中国电信获悉,中国电信人工智能研究院(TeleAI)于近日发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是目前国内支持
今天上午,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型——包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio。
2月18日,上海阶跃星辰智能科技有限公司发布消息称,公司与吉利汽车集团联合开源了两款阶跃 Step 系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。目前,已经可以在跃问 App 内体验。
2月18日,吉利汽车集团和阶跃星辰联合宣布:将双方合作研发的两款阶跃Step系列多模态大模型向全球开发者开源。其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio。
【大河财立方 记者 王宇 上海报道】2月18日,大河财立方记者从上海AI大模型独角兽阶跃星辰获悉,阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。据悉,这也是阶跃星辰首次开源其Step系列基座模型。
据@钱江晚报2月18日消息,吉利与阶跃星辰合作研发的两款多模态大模型官宣开源,包含开源视频生成模型Step-Video-T2V,以及业内首款产品级开源语音交互大模型Step-Audio,为开源世界带来了超强的多模态大模型能力,将显著促进大模型技术的共享与创新,推动人工智能的普惠发
10月24日,趣丸科技宣布与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的创新范式,在声音克隆、跨语种合成、语音控制等任务中展现出卓越效果。