InternLM-XComposer 项目是一个开源的大型视觉语言模型,支持长文本输入和输出,专注于图像和文本的理解与生成,具备多种应用场景,如视频理解、多轮多图对话、高分辨率图像理解、网页制作、文章创作等,并且在多个多模态基准测试中表现出色。
【DeepSeek发布新款开源多模态AI模型Janus-Pro】财联社1月28日电,人工智能社区Hugging Face显示,DeepSeek刚刚发布了开源多模态人工智能(AI)模型Janus-Pro。
3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破。目前,“书生2.5”多模态通用大模型已在通用视觉开源平台OpenGVLab开源(https://github.
【环球网科技综合报道】8月25日,记者从阿里云方面获悉,阿里云推出大规模视觉语言模型Qwen-VL,一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。
5月6日,在华为昇腾AI开发者峰会上,中国科学院自动化研究所“紫东太初”大模型研究中心常务副主任王金桥研究员透露,基于华为全栈国产化软硬件平台昇腾AI与开源AI框架昇思MindSpore,自动化研究所和武汉人工智能研究院正在联合打造“紫东太初”2.
其实,早在去年12月Vary团队就发布了Vary的首项研究成果“Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models”。
来源:环球网 【环球网科技综合报道】8月7日消息,人工智能公司面壁智能宣布正式开源其最新的端侧AI多模态模型——MiniCPM-V 2.6。官方称 MiniCPM-V 2.6 模型仅 8B 参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩。