21世纪经济报道记者白杨 北京报道6月中旬,音视频编解码标准(AVS)工作组正式宣布,《信息技术 智能媒体编码 第10部分:实时语音》(以下简称AVS3-P10)已经完成FCD(Final Committee Draft)阶段,即将正式对外发布。
(本视频中的数字主持人根据记者形象、声音通过文字脚本由AI深度合成)AI“歌神”请出战 | 文博会上新综艺《歌手2024》全网“摇人”,谁能“出战”?5G时代,有AI帮忙,五音不全的人也能分分钟变身超级“歌神”?
AI歌手顾名思义是由计算机技术生成的歌手。通过人工智能软件将歌手的声音数据输入、训练,再以具有仿冒歌手音质感的声音唱出其他歌曲。当前的AI技术逐渐能以较大规模深度合成人声,用一个人的声音素材“仿真”组合出他没有说过的话、唱过的歌。
6月25日,腾讯音乐与国际知名男子演唱组合WESTLIFE西城男孩联合打造的首个官方授权的跨语种全AI合作——全中文合唱单曲《越爱越强》。据介绍,歌曲由TME旗下酷狗音乐自研的多语种AI唱歌黑科技“AIK”提供技术支持。
ChatGPT 问世才 17 个月,OpenAI 就拿出了科幻电影里的超级 AI,而且完全免费,人人可用。当各家科技公司还在追赶大模型多模态能力,把总结文本、P 图等功能放进手机里的时候,遥遥领先的 OpenAI 直接开了大招,发布的产品连自家 CEO 奥特曼都惊叹:就像电影里一样。
极目新闻记者 周丹只需要一段音频、一张照片,就能让人物开口唱歌说话?是真的!让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子……都能成为现实!不久前,这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外,模型的产品化进程也广受关注。
来源:环球网 【环球网科技综合报道】把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前,这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外,模型的产品化进程也广受关注。