OpenAI处理图像语音

资讯

OpenAI发布实时API AI实时语音时代加速到来
本报记者吴清北京报道OpenAI实时API（应用程序接口）公开测试版发布，推动AI应用的加速落地。近日，OpenAI发布了其实时API公开测试版，为开发者提供了构建基于GPT-4大型语言模型的高交互性AI应用程序的机会。
中国经营报
电影中的人工智能来了！OpenAI发布全能大模型：文图音任意组合输出，可实现人类级别响应
01:07澎湃新闻编辑李垚瑞(01:07)OpenAI的新品终于官宣，是一个“全能助手”。北京时间5月14日凌晨，OpenAI发布最新多模态大模型 GPT-4o（o代表omini，全能），支持文本、音频和图像的任意组合输入，并生成文本、音频和图像的任意组合输出。
澎湃新闻
3评论
OpenAI一夜干翻语音助手！ChatGPT学会看屏幕，现实版Her来了
作者 | 智东西编辑部顶尖AI产品的对决，将在这两天集中上演。智东西5月14日报道，今日凌晨1点，抢在谷歌年度开发者大会Google I/O开幕前，OpenAI举办春季线上直播，宣布将推出桌面版ChatGPT，并发布全新旗舰AI模型GPT-4o。
智东西
35评论
OpenAI发布语音模型Voice Engine，出于安全考虑仅小范围试用
界面新闻记者 | 于浩界面新闻编辑 | 文姝琪3月30日，OpenAI在官网上公开了其最新的研究成果——“Voice Engine”。这项技术可通过简短的15秒音频样本和文本输入，生成与原始说话者极为相似的自然语音。
界面新闻
4评论
重磅！类人速度超快语音响应！OpenAI推出新旗舰模型GPT-4o，图文音频手机AI搞定
简要来说，OpenAI的发布会主要干了两件事情:发布最新GPT-4o多模态大模型，相较于GPT-4 Trubo速度更快、价格也更便宜。
每日经济新闻
261评论
Open AI发布实时响应的GPT-4o AI模型国产手机AI语音助手能赶上吗？
每经记者：王晶每经编辑：梁枭北京时间5月14日凌晨，Open AI公布了最新的GPT-4o人工智能模型，其中“o”代表“Omnimodel”（全能模型）。
每日经济新闻
2评论
OpenAI颠覆世界：GPT-4o完全免费，实时语音视频交互震撼全场
ChatGPT 问世才 17 个月，OpenAI 就拿出了科幻电影里的超级 AI，而且完全免费，人人可用。当各家科技公司还在追赶大模型多模态能力，把总结文本、P 图等功能放进手机里的时候，遥遥领先的 OpenAI 直接开了大招，发布的产品连自家 CEO 奥特曼都惊叹:就像电影里一样。
机器之心Pro
173评论
OpenAI再炸场人类全能AI助手梦幻成真
21世纪经济报道记者孔海丽、实习生邓熙涵北京报道北京时间5月14日凌晨，OpenAI再放大招，新推出的GPT-4o改写了大模型交互定义，可以实时对音频、视觉和文本进行推理，语音响应时间短至232毫秒，与人类反应速度一致，在无延迟语音对话中，GPT-4o的节奏、语气甚至接梗，与真
21世纪经济报道

视频