美国时间9月21日凌晨,OpenAI官宣文生图AI工具DALL·E系列迎来最新版本DALL·E 3。还记得去年DALL·E 2发布时,带动了一波AI文生图模型热,包括Stable Diffusion在内的众多与AI生图有关的工具、模型都是在当时推出的。
当地时间9月20日,OpenAI发布了DALL·E 3,这是其文本到图像工具的最新版本,它使用人工智能聊天机器人ChatGPT来帮助填写提示。OpenAI表示,DALL·E 3将于10月份通过API提供给ChatGPT Plus和企业客户。
DALL·E 3 是 OpenAI 在上个月发布的一个文生图模型。相对于 Midjourney 以及 Stable Diffusion,DALL·E 3 最大的便利之处在于,用户不需要掌握 Prompt 的写法了,直接自然语言描述即可。
·DALL·E 3的卓越语言对齐能力是建立在坚实的文本GPT基础之上的。MidJourney实际上没有太多的推理大脑,这就是为什么需要大量的提示词。“首先是‘大脑’,其次才是像素——这是构建强大多模态人工智能的方式。
DALL·E3 使用方法技巧汇总。DALL·E 3是由OpenAI开发的先进AI图像生成模型。DALL·E 3在细节处理、创意表达和图像质量方面相较之前有显著提升,广泛应用于艺术创作、设计、教育等领域。
作者使用到的两个Prompt是:一张黑白的漫威风格漫画图片, 一位老人右手搭在一个青年的肩膀上, 青年在图片左侧, 老人在图片右侧, 老人的脑袋右边有个对话气泡, 对话气泡中的文字是 “With great power comes great responsibility.”
在一年一度的MAX大会上,Adobe推出了一系列新功能。随后在DALL·E 3和Firefly Image 2对比上来看,Firefly Image 2生成的人像更接近于“照片清晰度”,而DALL·E 3生成的更像是画像。
10月11日凌晨,设计软件巨头Adobe宣布推出一系列图像生成模型,其中Firefly Image 2作为新一代图像生成器,通过改善皮肤、头发、眼睛、手和身体结构增强了人体渲染质量,提供更好的色彩和改进的动态范围,并为用户提供更大的控制输出的能力 。
人工智能巨头开始进一步考量如何保证AI生成内容的真实性。当地时间5月7日,OpenAI发布一款图像检测分类器,能够区分非人工智能生成的图像和DALL-E 3生成的图像,能正确识别约98%的DALL-E 3生成图像。
5月8日,美国科技公司OpenAI公告称公司推出了一款可以检测图片是否是由自家AI生成的图片的AI图片检测分类工具,该工具主要用于甄别图像是由OpenAI的“文生图”工具DALL·E3生成的概率,该工具目前已经开放了部分内测名额。