·DALL·E 3的卓越语言对齐能力是建立在坚实的文本GPT基础之上的。MidJourney实际上没有太多的推理大脑,这就是为什么需要大量的提示词。“首先是‘大脑’,其次才是像素——这是构建强大多模态人工智能的方式。
每经记者:李少婷 每经编辑:梁枭丨 2024年5月15日 星期三 丨NO.1 OpenAI 发布最新旗舰模型GPT-4o北京时间5月14日凌晨1点,OpenAI官宣推出新的大语言模型GPT-4o。这是其已经问世一年多的GPT-4模型的更新版本。
10月26日,腾讯宣布腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能,据介绍升级后的腾讯混元中文能力整体超过GPT3.5,代码能力大幅提升20%。作为实用级的通用大模型,腾讯混元大模型已在腾讯内部多个产品应用。
生成式AI正在从文本走向图像生成,这对于广告业的影响是深远的。当地时间9月20日,OpenAI推出了文本生成图像工具最新版本Dall-E3,该工具将于10月通过API向ChatGPT Plus和Enterprise客户提供。
视频生成模型 Sora 横空出世半个月后,仍在强势刷屏。这款 AI 可以生成长达 60 秒的高质量视频。最令人恐惧的是,其学习的对象不局限于画面、像素,Sora 还“学会”了一些视频中呈现的物理规律(比如人在雨后走过,水面有倒影)。
OpenAI对GPT-4o和Sora进行了重大更新,提供了全新文生图模型。除了文生图,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能,例如,更改图片的宽高比、图像物体中的角度,用十六进制代码指定精确颜色等。
每经记者:王晶 每经编辑:魏官红苹果正在加快设备AI(人工智能)化,以追赶其他手机、电脑厂商的AI进程。近日有消息称,iPhone或将用上ChatGPT。据澎湃新闻等媒体报道,5月11日,苹果公司被曝正与OpenAI敲定一项协议,今年将后者的部分技术引入iPhone。
年终总结你写好了吗?在2023年的倒数第二周,被网友戏称为真人版“硅谷真还传”的主角之一、OpenAI CEO山姆·奥特曼,就给这一年打上了一个新标签——“世界开始认真对待人工智能的一年”,并将他的17条总结经验公布在网上,希望对正在思考2024年该做什么的人们有所帮助。
本报记者 李静 北京报道今年6月开始对外测试的快手“可灵”生成式视频大模型,目前正在寻求更多商业变现的可能。8月20日,快手发布2024年第二季度及中期业绩,第二季度快手总营收同比增长11.6%至310亿元,经调整净利润同比增长73.7%达46.8亿元。