a. OpenAI发布了ChatGPT 4o的展示视频,ChatGPT 4o与人沟通的语音能力大大增强了,从语调,停顿等方面来看,感觉在和一个真人进行对话,能够根据上下文调整情绪,表现出喜怒哀乐等情感,使得对话更加生动,而且还能实现多人同时沟通,意味着能同时识别不同人的发言,这缩小了人与机器交流之间的差距,官方宣称是用end to end的技术,意味着这不是将语音转换成文字后由ChatGPT给出文字回答,然后再转换成语音的方法,应该是把大量的语音进行训练后再加入已经训练好的文字模型中,所以这个4o的大模型就能知道在沟通中的哪个停顿点需要说话了,并记住所有人的发言。
撰文:杨秋秋、吴一凡、徐弢、张司钰、徐豫编辑:吴洋洋Key Points百川发布第四代大模型和首款应用「百小应」;面壁智能推出最新端侧模型MiniCMP;小鹏汽车上线端到端模型;GPT-4o推出后,ChatGPT移动端收入增长;GPT-4o大模型语音引发争议;复旦研究团队突破大脑
这两年间,AI的发展好像被按下了快进键,去年ChatGPT4.0和Sora横空出世;今年,OpenAI又推出了ChatGPT4o,这标志着科技的又一大飞跃。相信许多人一定会问,AI的迭代升级对未来、对教育会产生什么样的影响?创新人才需要具备哪些品质?
5 月 13 日,OpenAI 用一场春季发布会,再次搅动了整个 AI 行业。在 Sam Altman 缺席的情况下,OpenAI CTO Mira Murati 担纲介绍了新的 ChatGPT 产品 ChatGPT-4o。
5月30日消息,OpenAI 宣布,ChatGPT 免费用户现在可以尝试更多 GPT-4o 的新功能,包括自定义 GPT 模型、数据分析和图表创建等。此前这些高级功能仅对付费用户开放,现在所有用户均可体验这些功能,免费用户的体验不再受限。
据澎湃新闻报道,当地时间5月13日,OpenAI推出新旗舰模型GPT-4o,可以实时对音频、视觉和文本进行推理。据介绍,新版模型能够带着情感与用户对话,还能假装兴奋、友好,甚至讽刺,其响应时间最短也来到了232毫秒,这与人类在对话中的响应时间相似。
在全球化竞争日益激烈的今天,高质量的机器翻译对于提升工作效率、降低沟通成本至关重要。最新发布的AI翻译场景应用实力比拼报告中,腾讯元宝在专家评分中荣获第一,超越了ChatGPT-4o,展现了其在翻译领域的卓越实力。此次测评通过10大测试题,全面考察了八款主流AI大模型的翻译能力。
美国开放人工智能研究中心13日展示了最新版本ChatGPT的新技能:与使用者展开语音对话、识别图像并展开讨论、翻译……GPT-4o为新版本编号。据路透社报道,相比先前版本,GPT-4o与使用者对话基本无延迟,和人类反应速度类似。即使对话中途被打断,也能继续下去。