近几年,短视频作为新媒体的载体,越来越火热;现已发展成为了信息传播的主体。随着行业的火热发展,字节跳动,百度,腾讯先后推出了【剪映】、【智影】等视频剪辑软件。巨头的入局,拉低了视频制作的门槛。在视频制作中,画面、音频、文稿是重要的三要素。其中一个有特色的声音,能瞬间引起关注。
GPT-SoVITS:一个声音克隆和文本到语音转换的开源 Python RAG框架,只需1分钟语音即可训练一个自己的TTS模型。 - 精选真开源 释放新价值概览语音克隆,这一神秘而又引人入胜的技术,正以前所未有的速度崭露头角。
池炜恒(池化) 投稿量子位 | 公众号 QbitAI开源数字人实时对话Demo来了~支持语音输入和实时对话,数字人形象可自定义的那种。生成的数字人效果belike:目前这个数字人实时对话Demo已在阿里巴巴ModelScope魔搭社区上线。