美国人工智能研究公司OpenAI近日宣布,即日起开始向部分ChatGPT Plus用户推出GPT-4o的语音模式。这一高级语音模式能够提供更为自然的实时对话,用户可以随时打断对话,而GPT-4能够感知并响应用户的情绪。
·OpenAI表示,ChatGPT API不仅仅能用于创建人工智能聊天界面,其名为gpt-3.5-turbo的新模型系列是“许多非聊天用例的最佳模型”。·Snap、Quizlet、Instacart和Shopify是ChatGPT API的早期采用者之一。
ChatGPT 问世才 17 个月,OpenAI 就拿出了科幻电影里的超级 AI,而且完全免费,人人可用。当各家科技公司还在追赶大模型多模态能力,把总结文本、P 图等功能放进手机里的时候,遥遥领先的 OpenAI 直接开了大招,发布的产品连自家 CEO 奥特曼都惊叹:就像电影里一样。
2025 年 3 月 21 日,OpenAI 在其开发者直播中正式推出新一代语音智能体解决方案,通过全新的 gpt-4o 系列音频模型与突破性的 API 定价策略,宣告 AI 交互进入自然语音时代。此次发布不仅带来了语音识别准确率的显著提升,更以颠覆性的价格体系重新定义行业标准。
来源:环球时报 【环球时报特约记者 谢昭 环球时报记者 刘扬】美国人工智能公司OpenAI于14日凌晨正式推出新一代人工智能(AI)模型GPT-4o,美国有线电视新闻网(CNN)注意到,它的最突出特点是在与人的交互方面更为自然。
美东时间3月20日OpenAI发布三款语音模型语音转文本模型GPT-4o-Transcribe和GPT-4o-Mini-Transcribe文本转语音模型GPT-4o-MiniTTS图源:OpenAI据了解,语音转文本模型准确率大幅提升在英语、西班牙语中单词错误率仅约2%在普通话
每经记者:蔡鼎 每经编辑:兰素英,孙志成美西时间5月13日(周一),OpenAI首席技术官Mira Murati在备受期待的直播演示中宣布,推出名为GPT-4o的新旗舰AI模型,这是其已经问世一年多的GPT-4模型的更新版本。