机器之心报道编辑:泽南现在,你可以指导 GPT-4o 的说话方式了。今天凌晨,OpenAI 突然开启了新产品发布直播,这次新发布的内容全是音频模型。据介绍,它们实现了新的 SOTA 水平,在准确性和可靠性方面优于现有解决方案——尤其是在涉及口音、嘈杂环境和不同语速的复杂场景中。
2025 年 3 月 21 日,OpenAI 在其开发者直播中正式推出新一代语音智能体解决方案,通过全新的 gpt-4o 系列音频模型与突破性的 API 定价策略,宣告 AI 交互进入自然语音时代。此次发布不仅带来了语音识别准确率的显著提升,更以颠覆性的价格体系重新定义行业标准。
奥特曼发布“年终总结”,并再次回应一切。当地时间1月6日,人工智能巨头OpenAI CEO山姆·奥特曼(Sam Altman)发布了一篇长文,回顾了OpenAI的创业路以及对于2025年的展望。他表示:“我们现在确信,知道如何按照我们传统的理解来建造AGI(通用人工智能)。
每经记者:岳楚鹏 每经编辑:高涵|2025年1月24日星期五|NO.1 三星推出AI手机Galaxy S25近日,三星发布了Galaxy S25 AI 智能手机,搭载高通芯片和谷歌AI模型Gemini。
每经记者:蔡鼎 每经实习记者:宋欣悦 每经编辑:兰素英当地时间12月4日,OpenAI突然在社交平台上放出“王炸”,宣布从12月5日开始,OpenAI的圣诞季特别活动即将拉开帷幕,活动持续12天,期间会放出“一大堆新事物”。
每经记者:岳楚鹏 每经编辑:兰素英|2025年3月21日 星期五|NO.1 苹果被曝重组高层以解决Siri AI功能延期问题当地时间3月20日,据外媒报道,库克对苹果AI主管詹南德雷亚执行产品开发的能力失去了信心。
21世纪经济报道记者孔海丽、实习生邓熙涵 北京报道北京时间5月14日凌晨,OpenAI再放大招,新推出的GPT-4o改写了大模型交互定义,可以实时对音频、视觉和文本进行推理,语音响应时间短至232毫秒,与人类反应速度一致,在无延迟语音对话中,GPT-4o的节奏、语气甚至接梗,与真