开源多模态模型

资讯

一个开源的多模态大模型：InternLM-XComposer
InternLM-XComposer 项目是一个开源的大型视觉语言模型，支持长文本输入和输出，专注于图像和文本的理解与生成，具备多种应用场景，如视频理解、多轮多图对话、高分辨率图像理解、网页制作、文章创作等，并且在多个多模态基准测试中表现出色。
AI工具箱
2评论
DeepSeek发布新款开源多模态AI模型Janus-Pro和JanusFlow
当地1月27日，据AI社区Hugging Face，DeepSeek发布分别名为Janus-Pro和JanusFlow的一系列开源多模态AI模型。
界面快讯
14评论
DeepSeek发布新款开源多模态AI模型Janus-Pro
【DeepSeek发布新款开源多模态AI模型Janus-Pro】财联社1月28日电，人工智能社区Hugging Face显示，DeepSeek刚刚发布了开源多模态人工智能（AI）模型Janus-Pro。
财联社
94评论
商汤科技开源多模态多任务通用大模型“书生（INTERN）2.5
3月14日，商汤科技发布多模态多任务通用大模型“书生（INTERN）2.5”，在多模态多任务处理能力方面实现多项全新突破。目前，“书生2.5”多模态通用大模型已在通用视觉开源平台OpenGVLab开源（https://github.
随申Hi
1评论
阿里云开源通义千问多模态大模型Qwen-VL
【环球网科技综合报道】8月25日，记者从阿里云方面获悉，阿里云推出大规模视觉语言模型Qwen-VL，一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入，具备多模态信息理解能力。
环球Tech
阿里云通义开源首个多模态推理模型QVQ
12月25日，阿里云通义千问发布首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力，在解决数学、物理、科学等领域的复杂推理问题上表现尤为突出。
界面快讯
1评论
在这场华为AI开发者峰会上，“紫东太初”开源图文音多模态大模型
5月6日，在华为昇腾AI开发者峰会上，中国科学院自动化研究所“紫东太初”大模型研究中心常务副主任王金桥研究员透露，基于华为全栈国产化软硬件平台昇腾AI与开源AI框架昇思MindSpore，自动化研究所和武汉人工智能研究院正在联合打造“紫东太初”2.
上观新闻
9评论
年轻人的第一个多模态大模型，1080Ti轻松运行，已开源在线可玩
其实，早在去年12月Vary团队就发布了Vary的首项研究成果“Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models”。
量子位
50评论
面壁智能宣布开源 MiniCPM-V 2.6 模型，端侧AI多模态能力增强
来源：环球网【环球网科技综合报道】8月7日消息，人工智能公司面壁智能宣布正式开源其最新的端侧AI多模态模型——MiniCPM-V 2.6。官方称 MiniCPM-V 2.6 模型仅 8B 参数，取得 20B 以下单图、多图、视频理解 3 SOTA 成绩。
环球网
DeepSeek再发新模型
中新网1月28日电(中新财经记者吴家驹) 1月28日凌晨，人工智能社区Hugging Face显示，DeepSeek发布了开源多模态AI模型Janus-Pro。
中国新闻网
11评论

视频