你能想象郭德纲用流利的英语说相声,而美国女歌手泰勒·斯威夫特则操着一口标准普通话畅谈自己专辑创作的幕后故事吗?十月底,一大批没有翻译腔的“配音”视频在网上走红了,这不是哪个网友在玩明星配音,而是深度模拟AI的作品。
在过去的几年中,研究人员专注于每种单一模态的生成,并取得了巨大进步:在文本生成方面,我们见证了文本生成效果的质的飞跃:从BERT 、GPT1 、GPT2 、GPT3 、GPT4 到ChatGPT 、LLaMA 、,模型参数的数量和训练样本的增长迅速,导致模态能力和产品部署的持续增长。
本报记者 秦枭 北京报道近日,一段郭德纲用外语说相声,知名歌星泰勒·斯威夫特、演员艾玛·沃森等外国名人说地道中文的视频在社交平台上疯传,该视频实际由AI合成,不仅能模仿演员原声、腔调,甚至口型也对得上,让不少观众觉得惊讶。