可以定制ai声音的模型

资讯

谷歌新技术可用AI模型为无声视频配音
谷歌DeepMind 近日公布了一项利用 AI 为无声视频生成背景音乐的“video-to-audio”技术。当前 DeepMind 这款 AI 模型依然存在局限性，需要开发者使用提示词为模型预先“介绍”视频可能的声音，暂时不能直接根据视频画面添加具体音效。
第一财经
迄今最复杂人工智能语音模型创建，可模仿人的原声
Meta称研制出迄今最复杂人工智能语音模型。图片来源：英国《每日邮报》网站科技日报记者刘霞据英国《每日邮报》23日报道，脸书母公司元宇宙平台公司（Meta）称，其已研制出“迄今功能最强大的语音生成式人工智能Voicebox”，它能够模仿任何人的声音，包括逝者。
极目新闻
英伟达对外展示了一款模型，可以生成音乐和音频
当地时间11月25日，芯片巨头英伟达展示了一款用于生成音乐和音频的人工智能模型Fugatto。该模型可以根据文本提示修改声音、产生新的声音。不过英伟达目前没有公开发布Fugatto技术。
澎湃新闻
英伟达展示AI模型Fugatto：能修改并生成新声音
当地时间26日，英伟达展示了名为Fugatto的人工智能模型，该模型能够修改声音并生成新的声音效果，旨在为音乐、电影和视频游戏制作人提供服务。Fugatto能够根据文本描述生成音效和音乐，包括将钢琴演奏转换成人声歌唱，或改变录音的口音和情绪。
第一财经
1评论
前DeepMind大佬创业，做出喜怒哀乐以假乱真的AI语音大模型
编译 | 徐豫编辑 | 云鹏智东西2月27日消息，美国情感智能技术AI创企Hume AI昨天发布了新款文生语音大模型Octave，该大模型可依据用户输入的提示词或剧本，生成有人设特点、有语调起伏、有情感色彩的AI语音，并允许用户通过文本指令二次调整和创作。
智东西
2评论
几句话就能写歌，还能模拟各种音效，Meta发布开源AI工具AudioCraft
Meta称，这款开源AI工具综合使用了AudioGen、EnCodec和MusicGen等大模型，不仅可以生成各种模拟音频效果，还能减少音损。
智东西
试了试Meta的最新语音生成器，逼真得有点毛骨悚然
6 月，Meta 曾推出全新的语音生成 AI 模型—— VoiceBox，能从文本直接生成高质量语音，不需要任何语音样本作为训练数据。
AI好好用
16评论
只需15秒原声，AI就能复刻！如何保证被安全使用？
只需生前15秒的原声素材，AI就能复刻逝者的声音并以语音回信的方式陪人谈心。5月11日，34岁的武汉市更好创新科技有限公司创始人徐祥鹏告诉记者，自己研发的AI产品“宛在”上线不到一周就有了千余用户，定制生成一分钟的音频只需9.9元。武汉市更好创新科技有限公司创始人徐祥鹏。
长江日报
1评论
录一句话，AI就能学会你说话！讯飞星火再升级多项功能首发
图说：讯飞星火大模型V3.5春季上新采访对象供图（下同）今天，讯飞星火大模型V3.5春季上新。面向高效准确知识获取的痛点，科大讯飞发布业界首个长文本、长图文、长语音大模型——不仅能够快速学习各种信息来源的海量文本、图文资料、会议录音，还能够在各种行业场景给出专业、准确回答。
新民晚报
1评论
AI克隆人声不设限错误内容随意生成
截至10月23日，“Reecho睿声”上仍有三个名为“雷军”的克隆声音模型可正常使用。网络截图【编者按】 2021年11月1日，《中华人民共和国个人信息保护法》正式施行，为我国个人信息保护提供了更具系统性、针对性和可操作性的法律遵循。
南方都市报

视频