本报记者 吴清 北京报道OpenAI实时API(应用程序接口)公开测试版发布,推动AI应用的加速落地。近日,OpenAI发布了其实时API公开测试版,为开发者提供了构建基于GPT-4大型语言模型的高交互性AI应用程序的机会。
21世纪经济报道记者白杨 北京报道6月中旬,音视频编解码标准(AVS)工作组正式宣布,《信息技术 智能媒体编码 第10部分:实时语音》(以下简称AVS3-P10)已经完成FCD(Final Committee Draft)阶段,即将正式对外发布。
豆包即将发布最新实时语音大模型,并将基于此模型全量上线豆包App实时语音通话功能。目前,豆包APP已小范围测试最新能力,部分用户在豆包App的实时通话界面已更新。此前,业内就曾有消息称豆包将上线最新情感语音大模型,测试效果超过GPT-4o。
每经编辑:杜宇OpenAI为期12个工作日的新产品和技术发布活动出了新王炸:在首次公开演示将近七个月后,OpenAI正式面向广大付费用户推出ChatGPT类人高级人工智能(AI)语音助手的新功能,包括视频对话和实时屏幕共享,以及一个增添节日趣味的“圣诞老人”音色。
生成式人工智能正以令人惊叹的速度实现突破,像与 ChatGPT、豆包这类 AI 智能助手对话,不再局限于文字,也可以通过语音通话进行实时、生动的交流。语音是人类最自然便捷的沟通方式,语音交互大幅降低与 AI 对话的门槛。