【OpenAI发布新文生图模型】财联社3月26日电,OpenAI当地时间25日对GPT-4o和Sora进行了重大更新,提供了全新文生图模型。除了文生图之外,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能。
《科创板日报》9月21日讯9月21日凌晨,OpenAI推出了其文本转图像工具DALL-E的升级版本“DALL•E 3”,这款新工具在理解用户命令和将生成更高质量的图像方面表现更出色,将比前两代功能更加强大。
在OpenAI和谷歌接连发布展现出强大性能的AI(人工智能)大模型后,AI初创企业Stability AI也坐不住了。当地时间2月21日,Stability AI推出了旗下文生图模型的最新版本Stable Diffusion 3 (SD3),在官网上开放等候名单。
图像生成领域传来了新进展,OpenAI在攻克“生成图像中的文字”方面的难题。北京时间3月26日凌晨,OpenAI进行了直播,对GTP-4o和Sora进行更新,在ChatGPT和Sora中推出GPT-4o的图像生成功能。
极目新闻记者 张秀娟“美丽而繁华的东京正在下雪”“这个镜头要穿过繁忙的城市街道”“几个正在享受着美丽雪景而在附近购物的人们”“盛开的樱花花瓣随风起舞、落英缤纷”……当视频博主Gabor Csellev输入上述提示语时,由OpenAI推出的模型Sora,随即制作了一段精美的短视频。
·DALL·E 3的卓越语言对齐能力是建立在坚实的文本GPT基础之上的。MidJourney实际上没有太多的推理大脑,这就是为什么需要大量的提示词。“首先是‘大脑’,其次才是像素——这是构建强大多模态人工智能的方式。
3月26日凌晨,谷歌正式推出了旗下新一代大语言模型Gemini 2.5。谷歌将Gemini 2.5定义为公司迄今为止“最智能的AI模型”,Gemini 2.5 Pro实验版本在多项基准测试中全面超越OpenAI o3-mini、Claude3.