openai语音模型

资讯

OpenAI发布语音模型Voice Engine，出于安全考虑仅小范围试用
界面新闻记者 | 于浩界面新闻编辑 | 文姝琪3月30日，OpenAI在官网上公开了其最新的研究成果——“Voice Engine”。这项技术可通过简短的15秒音频样本和文本输入，生成与原始说话者极为相似的自然语音。
界面新闻
4评论
OpenAI最新音频模型一手实测！可癫可御可定制，中文有点翻车
据OpenAI介绍，这些模型大幅降低了单词识别错误率、语言识别能力与准确性，尤其是在涉及口音、嘈杂环境和不同语音速度等具有挑战性的场景。
智东西
OpenAI推出语音分析模型，MR头显概念股歌尔股份、立讯精密走强
OpenAI推出名为GPT-4o的新旗舰AI模型，GPT-4o增加了分析语音的功能，且能读取用户情绪。受此消息带动，A股MR头显、多模态模型、TWS耳机纷纷走强。信息技术ETF（562560）、5G通信ETF（515050）早盘冲高，盘中涨超1%。
每日经济新闻
苹果被曝重组高层以解决Siri AI功能延期问题；OpenAI公布新转录和语音生成AI模型丨全球科技早参
每经记者：岳楚鹏每经编辑：兰素英｜2025年3月21日星期五｜NO.1 苹果被曝重组高层以解决Siri AI功能延期问题当地时间3月20日，据外媒报道，库克对苹果AI主管詹南德雷亚执行产品开发的能力失去了信心。
每日经济新闻
OpenAI一口气发布三个新模型！
美东时间3月20日OpenAI发布三款语音模型语音转文本模型GPT-4o-Transcribe和GPT-4o-Mini-Transcribe文本转语音模型GPT-4o-MiniTTS图源：OpenAI据了解，语音转文本模型准确率大幅提升在英语、西班牙语中单词错误率仅约2%在普通话
光明网
OpenAI发布全新语音智能体对话交互进入"声临其境"时代
2025 年 3 月 21 日，OpenAI 在其开发者直播中正式推出新一代语音智能体解决方案，通过全新的 gpt-4o 系列音频模型与突破性的 API 定价策略，宣告 AI 交互进入自然语音时代。此次发布不仅带来了语音识别准确率的显著提升，更以颠覆性的价格体系重新定义行业标准。
齐鲁壹点
3评论
OpenAI发布新模型GPT-4o，平均响应时间为320毫秒，“几乎接近人类交谈”
来源：环球时报【环球时报特约记者谢昭环球时报记者刘扬】美国人工智能公司OpenAI于14日凌晨正式推出新一代人工智能（AI）模型GPT-4o，美国有线电视新闻网（CNN）注意到，它的最突出特点是在与人的交互方面更为自然。
环球网
23评论
新鲜早科技丨OpenAI语音模型15秒样本复刻人声；小米汽车交付时间延长，将第二轮加售；淘宝拟火箭送快递
21世纪经济报道数字经济课题组综合报道早上好，新的一天又开始了。在过去的24小时内，科技行业发生了哪些有意思的事情？来跟21tech一起看看吧。【巨头风向标】1、OpenAI语音生成模型15秒样本即可复刻人声。
21世纪经济报道
全球科技早参丨OpenAI发布语音模型Voice Engine
每经记者：蔡鼎每经编辑：兰素英｜2024年4月1日星期一｜NO.1 OpenAI发布语音模型Voice Engine3月30日，OpenAI在官网上公开了其最新的研究成果——“Voice Engine”。
每日经济新闻
1评论

视频

问答

如何评价OpenAI的超级对话模型ChatGPT？
https://chat.openai.
头条问答

在线举报