On August 29, the world's first professional, multimodal large language model for the field of lunar science has been released at the China International Big Data Industry Expo.
科技日报讯 (记者吴纯新 通讯员汪伟颋)3月23日,记者从华中科技大学获悉,由该校联合武汉金山办公软件有限公司研究人员开发的Monkey多模态大模型已被人工智能领域国际顶级会议CVPR 2024接收,且该大模型曾在大模型开源开放评测体系——“司南”多模态大模型排行榜中名列开源模型
但是,它们真的能够像人类一样,洞悉图片中的深层含义吗?为了探讨多模型大模型与人类的差距,来自中科院深圳先进院,M-A-P,华中科技大学,零一万物,滑铁卢大学等多家机构联合提出了首个用于评估多模态大模型图像隐喻理解能力的综合性基准测试II-Bench。
其实,早在去年12月Vary团队就发布了Vary的首项研究成果“Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models”。