在众多业内技术评测中,DeepSeek的这款新模型在图像生成基准测试中,超越了OpenAI的DALL-E 3和Stability AI的Stable Diffusion 3-Medium等竞品,成为了行业内的新标杆。
但是,它们真的能够像人类一样,洞悉图片中的深层含义吗?为了探讨多模型大模型与人类的差距,来自中科院深圳先进院,M-A-P,华中科技大学,零一万物,滑铁卢大学等多家机构联合提出了首个用于评估多模态大模型图像隐喻理解能力的综合性基准测试II-Bench。
DeepSeek前脚刚发布R1模型,又赶在大年三十发布了最新的多模态大模型Janus-Pro-7B,支持理解生成图片视频,这可能又是一个爆炸性的产品,要知道R1已经在海内外火的一塌糊涂,让英伟达股票大跌10%以上,连ChatGPT都回应:排名变化也许是暂时的。
当地时间12月9日,马斯克的人工智能初创公司xAI在官网正式宣布推出新的自回归图像生成模型Aurora,该模型可增加大模型Grok的图像生成能力。Grok的新功能已在特定国家的社交媒体平台X上提供,并将在一周内向所有用户推出。网友用Aurora生成的图片。
参考消息网1月29日报道据新加坡《联合早报》网站1月28日报道,中国初创企业深度求索(DeepSeek)公布低成本大模型后,除夕当天(1月28日)再发布开源文字生成图像(文生图)大模型Janus-Pro 7B,该模型在基准测试中超越美国巨头OpenAI。
9月12日,DBC德本咨询发布《2024AIGC创新TOP30》榜单,美图公司及美图奇想大模型(MiracleVision)荣登榜单,一同入选的还有百度、华为、字节跳动、腾讯、阿里巴巴、快手等企业及旗下大模型。
封面新闻记者 蔡世奇5月31日,快手正式对外开放自研大模型产品“可图”(Kolors),支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型”官方网站和微信小程序,免费使用各项AI图像功能。
未经微调的 GPT-3 模型在许多 NLP 任务上取得了可喜的结果,甚至偶尔超越了针对该特定任务进行微调的最先进模型:在 CoQA 基准测试中,零样本设置中的 F1 为 81.5,单样本设置中的 F1 为 84.0,少样本设置中的 F1 为 85.0,而微调 SOTA 获得的 F1 分数为 90.7。