据科技日报《自然》杂志15日介绍了一款人工智能(AI)模型,其宛如科幻小说里的“巴别鱼”,能直接“语音到语音”翻译多达101种语言的语音和文本。由Meta推出的这一模型名为SEAMLESSM4T,其填补了语言覆盖方面的空白,且性能优于现有其他系统。
简单的说就是你录一段你的说话发音,要正常的。不能说了半分钟都是相同的内容,可以朗读一小段文章之类,效果估计会比较好。如果只是啊哦额之类的半分钟,估计模拟不出来什么东西。然后就可以用一篇文章试试,是不是类似你自己朗读的发音了。
Hedra,只要上传照片和语言即可自动实现人物说话和唱歌等,当然也可以全用AI生成人物和语言。我们打开Hedra官网,可以用谷歌账号授权登录。点击Try beta进入操作界面,我们先上传照片和语音,看看生成的效果如何?
“未见其人,先闻其声”,如今在网络平台上,AI声音随处可见。随着算法不断进步,在高性能设备和高精度模型的助力下,AI生成的声音已从过去的“一听就假”发展到如今的 “真假难辨”。不少有声读物采用AI配音,读者甚至能选择模仿某个特定人的声音,这既降低了成本,也增添了趣味性。
人类对于AI有着美妙的幻想,现在,已经能够通过AI克隆你的声音。AI语音克隆已经是有非常显著的落地成果阶段,AI已经能够轻松且高精度地复制任何人的声音!大家好,我是tt,今天是成为科技自媒体博主的第4天!希望我能跟你一起从不同角度看世界这篇是【科技话题】-【AI时代】!