能理解并生成“夫妻肺片”“胸有成竹”的中文开源大模型出现了。5月14日,腾讯宣布,旗下混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。
机器之心报道作者:蛋酱这几天,打开社交媒体平台,很多人正在热烈讨论一个叫做「AI 模特」的玩法。点开几个 Demo,确实惊艳。下方视频是一位海外网友自制的穿搭合辑,你能分得清这是 AI 还是真人吗?来源:https://x.
近日,来自华为诺亚方舟实验室、大连理工大学、香港大学和香港科技大学的研究团队推出了一个能够直接生成4K分辨率图像的DiT模型——PixArt-Σ,与前一代模型相比,其图像的清晰度明显提高,并能够更好地贴合文本提示。
界面新闻记者 | 肖芳界面新闻编辑 | 宋佳楠5月30日,界面新闻从多位知情人士处获悉,快手自研文生图大模型“可图”已于近日正式对外开放。“可图”大模型目前支持文生图和图生图两类功能,可用于AI创作图像以及AI形象定制。
【快手文生图大模型可图正式开源】《科创板日报》6日电,在2024世界人工智能大会上,快手高级副总裁、主站业务与社区科学负责人盖坤宣布,快手文生图大模型可图正式开源,据悉,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型(可图、可灵)为核心的大模型矩阵。
12月19日,智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型评测结果。在语言模型测评中,针对一般中文场景的开放式问答或者生成任务,模型能力已趋于饱和稳定,但是在复杂的场景任务中,国内头部语言模型仍然与国际一流水平存在显著差距。