AI的飞速发展,让“未来已来”成为流行词。有人说,今年是AI元年。近20天,AI产业在众多领域推陈出新,技术日新月异。3月15日,ChatGPT-4发布。紧接着,Midjourney V5发布,其生成的AI画作真假难辨。
“未见其人,先闻其声”,如今在网络平台上,AI声音随处可见。随着算法不断进步,在高性能设备和高精度模型的助力下,AI生成的声音已从过去的“一听就假”发展到如今的 “真假难辨”。不少有声读物采用AI配音,读者甚至能选择模仿某个特定人的声音,这既降低了成本,也增添了趣味性。
当一首音乐作品呈现在人们面前之前,通常需要经历作曲、编曲、混音、母带等多重复杂的工序。但现在,一个没有任何音乐基础的普通人,只需打开AI音乐软件,用一段文字描述并设定音乐风格,AI即可迅速生成一首完整的由数字人声演唱的歌曲。生成式AI崛起以来,AI音乐一直是一个热门赛道。
来源:环球网 【环球网科技综合报道】把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前,这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外,模型的产品化进程也广受关注。
把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前,这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外,模型的产品化进程也广受关注。
来源:【海报新闻】海报新闻记者 孙杰 济南报道把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前,这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外,模型的产品化进程也广受关注。