界面新闻记者 | 于浩界面新闻编辑 | 文姝琪3月30日,OpenAI在官网上公开了其最新的研究成果——“Voice Engine”。这项技术可通过简短的15秒音频样本和文本输入,生成与原始说话者极为相似的自然语音。
OpenAI推出名为GPT-4o的新旗舰AI模型,GPT-4o增加了分析语音的功能,且能读取用户情绪。受此消息带动,A股MR头显、多模态模型、TWS耳机纷纷走强。信息技术ETF(562560)、5G通信ETF(515050)早盘冲高,盘中涨超1%。
每经记者:岳楚鹏 每经编辑:兰素英|2025年3月21日 星期五|NO.1 苹果被曝重组高层以解决Siri AI功能延期问题当地时间3月20日,据外媒报道,库克对苹果AI主管詹南德雷亚执行产品开发的能力失去了信心。
美东时间3月20日OpenAI发布三款语音模型语音转文本模型GPT-4o-Transcribe和GPT-4o-Mini-Transcribe文本转语音模型GPT-4o-MiniTTS图源:OpenAI据了解,语音转文本模型准确率大幅提升在英语、西班牙语中单词错误率仅约2%在普通话
2025 年 3 月 21 日,OpenAI 在其开发者直播中正式推出新一代语音智能体解决方案,通过全新的 gpt-4o 系列音频模型与突破性的 API 定价策略,宣告 AI 交互进入自然语音时代。此次发布不仅带来了语音识别准确率的显著提升,更以颠覆性的价格体系重新定义行业标准。
来源:环球时报 【环球时报特约记者 谢昭 环球时报记者 刘扬】美国人工智能公司OpenAI于14日凌晨正式推出新一代人工智能(AI)模型GPT-4o,美国有线电视新闻网(CNN)注意到,它的最突出特点是在与人的交互方面更为自然。
21世纪经济报道数字经济课题组综合报道早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起看看吧。【巨头风向标】1、OpenAI语音生成模型15秒样本即可复刻人声。
每经记者:蔡鼎 每经编辑:兰素英|2024年4月1日 星期一|NO.1 OpenAI发布语音模型Voice Engine3月30日,OpenAI在官网上公开了其最新的研究成果——“Voice Engine”。