·DALL·E 3的卓越语言对齐能力是建立在坚实的文本GPT基础之上的。MidJourney实际上没有太多的推理大脑,这就是为什么需要大量的提示词。“首先是‘大脑’,其次才是像素——这是构建强大多模态人工智能的方式。
AI图像生成领域传来了新进展。当地时间3月25日,OpenAI在直播中对GPT-4o和Sora进行更新,并宣布其最新一代多模态模型GPT-4o正式集成“迄今为止最先进的图像生成器”,并开放免费使用。这一动作被业界视为对同日凌晨Google发布的Gemini 2.
当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,OpenAI的CEO奥特曼称GPT-4o为“有史以来最好的模型”,并宣布将全面免费开放基础功能,API调用价格下调50%。