对于许多爱听音乐的用户而言,手机里常备的音乐应用想必会有网易云音乐、QQ音乐、或者是虾米音乐等。相对于大众化的音乐应用,小编更喜欢使用一些小众且有新意的音乐应用。毕竟有时候想听歌了,只是想听听那时那刻心情状态下的音乐,而不是听一下重复来重复去的歌曲。
只用输入一张图+一段音频,就能让照片里的人物动起来并开口说话:比如让张国荣翻唱陈奕迅的歌,让高启强用罗翔的声音讲普法课,把蔡徐坤变成“Rap之王”,还跟Sora生成的超逼真东京街头散步女子视频玩起了联动。
潮新闻客户端 记者 张云山把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前,这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外,模型的产品化进程也广受关注。
模型采用 stable diffusion 这一当下的主流框架作为整个模型基础框架,整个框架主要由两个阶段组成:在称为 Frames Encoding 这一初始阶段,ReferenceNet 用于从 reference image 和 motion frames 中提取特征。
当然没有人喜欢看别人的脸色,但是 emo 喜欢。只看名字大概就可以想到 emo 和 emotion(情绪)这个单词存在着某种神秘的联系。独立音乐应用 落网新推出的 emo 能通过看你脸色识别你当前的心情,再自动推荐播放符合你情绪的歌曲。
如果你喜欢听迷幻,你一定知道一个叫 Mazzy Star 的乐队,他们最著名的那张专辑封面是一只发光的白色天鹅,游荡在深邃的谧蓝色水面上,显得脆弱又骄矜。这只天鹅被落网简化加黑后变成了自己的 Logo,在众多音乐类 App 图标中显得特立独行又格格不入。
“网抑云”还没抑明白,emo又来了,没有5G别来年轻人的互联网冲浪。近日,某短视频平台活动“emo告别大会”如火如荼的举行着,人民网、湖南武警、江西消防等诸多官方账号都录制相关短视频鼓励大家走出emo。