生成式AI正在从文本走向图像生成,这对于广告业的影响是深远的。当地时间9月20日,OpenAI推出了文本生成图像工具最新版本Dall-E3,该工具将于10月通过API向ChatGPT Plus和Enterprise客户提供。
来源:解放日报智能时代的一次进化■有媒体称这预示着“智能时代的一次进化”,未来移动设备中的互联网可能会被浓缩在一个程序之中,用户可以通过它解决一切需求:发短信、导航、识物、打车等Sora之后,美国开放人工智能研究中心(OpenAI)昨天凌晨推出“王炸”新模型GPT-4o。
3月23日至24日,2024全球开发者先锋大会在徐汇西岸举办。今年大会主题为“模速空间——开发者的模力之源”。坐落于西岸传媒港的模速空间,正是全国首个、上海唯一的大模型创新生态社区。大会开幕式上,徐汇区领导从“模型、速度、空间”三个维度来阐释模速空间承载的功能和意义。
每经记者:文巧 郑雨航 或许,能打败OpenAI的只有OpenAI。2022年底,OpenAI推出人工智能聊天机器人ChatGPT,开启了大模型领域的“竞速跑”模式。2024年2月15日,随着视频生成模型Sora的横空出世,OpenAI再度掀起热潮。
5月8日,美国科技公司OpenAI公告称公司推出了一款可以检测图片是否是由自家AI生成的图片的AI图片检测分类工具,该工具主要用于甄别图像是由OpenAI的“文生图”工具DALL·E3生成的概率,该工具目前已经开放了部分内测名额。
·DALL·E 3的卓越语言对齐能力是建立在坚实的文本GPT基础之上的。MidJourney实际上没有太多的推理大脑,这就是为什么需要大量的提示词。“首先是‘大脑’,其次才是像素——这是构建强大多模态人工智能的方式。
Raffel, Colin, et al. “Exploring the limits of transfer learning with a unified text-to-text transformer.” The Journal of Machine Learning Research 21.1 : 5485-5551.
12月19日,智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型评测结果。在语言模型测评中,针对一般中文场景的开放式问答或者生成任务,模型能力已趋于饱和稳定,但是在复杂的场景任务中,国内头部语言模型仍然与国际一流水平存在显著差距。
美国时间9月21日凌晨,OpenAI官宣文生图AI工具DALL·E系列迎来最新版本DALL·E 3。还记得去年DALL·E 2发布时,带动了一波AI文生图模型热,包括Stable Diffusion在内的众多与AI生图有关的工具、模型都是在当时推出的。