GPT-SoVITS:一个声音克隆和文本到语音转换的开源 Python RAG框架,只需1分钟语音即可训练一个自己的TTS模型。 - 精选真开源 释放新价值概览语音克隆,这一神秘而又引人入胜的技术,正以前所未有的速度崭露头角。
引言:嘿,昨天后台有个小伙伴留言问:GPT-SOVITS能唱歌吗?我得说,它是个TTS,目前它还在学习如何优雅地发音,唱歌这事儿,它还在练习中。不过,别失望,AI唱歌这事儿,虽然已经不是什么新鲜技术,后续的版本一定会有的。回到AI唱歌,这就得交代一下RVC和TTS的区别了。
池炜恒(池化) 投稿量子位 | 公众号 QbitAI开源数字人实时对话Demo来了~支持语音输入和实时对话,数字人形象可自定义的那种。生成的数字人效果belike:目前这个数字人实时对话Demo已在阿里巴巴ModelScope魔搭社区上线。