本报记者 吴清 北京报道OpenAI实时API(应用程序接口)公开测试版发布,推动AI应用的加速落地。近日,OpenAI发布了其实时API公开测试版,为开发者提供了构建基于GPT-4大型语言模型的高交互性AI应用程序的机会。
01:07澎湃新闻编辑 李垚瑞(01:07)OpenAI的新品终于官宣,是一个“全能助手”。北京时间5月14日凌晨,OpenAI发布最新多模态大模型 GPT-4o(o代表omini,全能),支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。
作者 | 智东西编辑部顶尖AI产品的对决,将在这两天集中上演。智东西5月14日报道,今日凌晨1点,抢在谷歌年度开发者大会Google I/O开幕前,OpenAI举办春季线上直播,宣布将推出桌面版ChatGPT,并发布全新旗舰AI模型GPT-4o。
界面新闻记者 | 于浩界面新闻编辑 | 文姝琪3月30日,OpenAI在官网上公开了其最新的研究成果——“Voice Engine”。这项技术可通过简短的15秒音频样本和文本输入,生成与原始说话者极为相似的自然语音。
ChatGPT 问世才 17 个月,OpenAI 就拿出了科幻电影里的超级 AI,而且完全免费,人人可用。当各家科技公司还在追赶大模型多模态能力,把总结文本、P 图等功能放进手机里的时候,遥遥领先的 OpenAI 直接开了大招,发布的产品连自家 CEO 奥特曼都惊叹:就像电影里一样。
21世纪经济报道记者孔海丽、实习生邓熙涵 北京报道北京时间5月14日凌晨,OpenAI再放大招,新推出的GPT-4o改写了大模型交互定义,可以实时对音频、视觉和文本进行推理,语音响应时间短至232毫秒,与人类反应速度一致,在无延迟语音对话中,GPT-4o的节奏、语气甚至接梗,与真