据外媒消息,在人工智能领域持续创新的OpenAI公司,近日宣布了一项革命性的声音克隆技术——“语音引擎”。该技术作为其现有文本转语音API的扩展,仅需15秒的音频样本,便能模仿任何说话者的声音。OpenAI表示,这项新技术能够生成“自然的语音”和“情感丰富且真实的声音”。
21世纪经济报道记者孔海丽 实习生牛淑锐 北京报道继文生视频大模型Sora后,近日,OpenAI终于将按捺许久的语音引擎模型—Voice Engine公之于众。利用文本输入和单个15秒音频样本,Voice Engine就能生成与原说话者非常相似且情感丰富的自然语音。
只需生前15秒的原声素材,AI就能复刻逝者的声音并以语音回信的方式陪人谈心。5月11日,34岁的武汉市更好创新科技有限公司创始人徐祥鹏告诉记者,自己研发的AI产品“宛在”上线不到一周就有了千余用户,定制生成一分钟的音频只需9.9元。武汉市更好创新科技有限公司创始人徐祥鹏。
本报讯 (记者何文英)近日,万兴科技旗下视频创意软件WondershareFilmora升级至13.5版本,推出声音复刻、文生贴纸等创意AI功能,以及弯曲文本、仿射变换等高级剪辑功能,进一步赋能视频创作者的创意表达。
继 AI 拍照写真软件 " 妙鸭相机 " 一夜爆红后,一个基于 AI 技术克隆声音的网站 MyVocal.AI 又火了一把。这款声称可免费克隆声音的网站,不但可以克隆声音,还可以利用克隆的声音输出音乐和流利口播。
图说:讯飞星火大模型V3.5春季上新 采访对象供图(下同)今天,讯飞星火大模型V3.5春季上新。面向高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型——不仅能够快速学习各种信息来源的海量文本、图文资料、会议录音,还能够在各种行业场景给出专业、准确回答。