GPT-SoVITS:一个声音克隆和文本到语音转换的开源 Python RAG框架,只需1分钟语音即可训练一个自己的TTS模型。 - 精选真开源 释放新价值概览语音克隆,这一神秘而又引人入胜的技术,正以前所未有的速度崭露头角。
简单的说就是你录一段你的说话发音,要正常的。不能说了半分钟都是相同的内容,可以朗读一小段文章之类,效果估计会比较好。如果只是啊哦额之类的半分钟,估计模拟不出来什么东西。然后就可以用一篇文章试试,是不是类似你自己朗读的发音了。