谷歌DeepMind 近日公布了一项利用 AI 为无声视频生成背景音乐的“video-to-audio”技术。当前 DeepMind 这款 AI 模型依然存在局限性,需要开发者使用提示词为模型预先“介绍”视频可能的声音,暂时不能直接根据视频画面添加具体音效。
Meta称研制出迄今最复杂人工智能语音模型。图片来源:英国《每日邮报》网站科技日报记者 刘霞据英国《每日邮报》23日报道,脸书母公司元宇宙平台公司(Meta)称,其已研制出“迄今功能最强大的语音生成式人工智能Voicebox”,它能够模仿任何人的声音,包括逝者。
当地时间26日,英伟达展示了名为Fugatto的人工智能模型,该模型能够修改声音并生成新的声音效果,旨在为音乐、电影和视频游戏制作人提供服务。Fugatto能够根据文本描述生成音效和音乐,包括将钢琴演奏转换成人声歌唱,或改变录音的口音和情绪。
编译 | 徐豫编辑 | 云鹏智东西2月27日消息,美国情感智能技术AI创企Hume AI昨天发布了新款文生语音大模型Octave,该大模型可依据用户输入的提示词或剧本,生成有人设特点、有语调起伏、有情感色彩的AI语音,并允许用户通过文本指令二次调整和创作。
只需生前15秒的原声素材,AI就能复刻逝者的声音并以语音回信的方式陪人谈心。5月11日,34岁的武汉市更好创新科技有限公司创始人徐祥鹏告诉记者,自己研发的AI产品“宛在”上线不到一周就有了千余用户,定制生成一分钟的音频只需9.9元。武汉市更好创新科技有限公司创始人徐祥鹏。
图说:讯飞星火大模型V3.5春季上新 采访对象供图(下同)今天,讯飞星火大模型V3.5春季上新。面向高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型——不仅能够快速学习各种信息来源的海量文本、图文资料、会议录音,还能够在各种行业场景给出专业、准确回答。
截至10月23日,“Reecho睿声”上仍有三个名为“雷军”的克隆声音模型可正常使用。 网络截图 【编者按】 2021年11月1日,《中华人民共和国个人信息保护法》正式施行,为我国个人信息保护提供了更具系统性、针对性和可操作性的法律遵循。