多模态大模型英文

资讯

OCR终结了？旷视提出支持文档级OCR的多模态大模型，支持中英文
国科大&旷视团队投稿量子位 | 公众号 QbitAI想将一份文档图片转换成Markdown格式？
量子位
47评论
每日一词|月球科学多模态专业大模型 professional, multimodal large language model (LLM) for the field of lunar science
On August 29， the world's first professional， multimodal large language model for the field of lunar science has been released at the China International Big Data Industry Expo.
中国日报网
多模态大模型Monkey发布升级版
科技日报讯（记者吴纯新通讯员汪伟颋）3月23日，记者从华中科技大学获悉，由该校联合武汉金山办公软件有限公司研究人员开发的Monkey多模态大模型已被人工智能领域国际顶级会议CVPR 2024接收，且该大模型曾在大模型开源开放评测体系——“司南”多模态大模型排行榜中名列开源模型
中国青年网
3评论
腾讯最新综述高效多模态大模型：性能要强，规模要小
在过去一年里，多模态大语言模型在视觉问答、视觉理解和推理等任务中展现了卓越性能。论文标题:Efficient Multimodal Large Language Models:A Survey。
夕小瑶科技说
2评论
大模型能看懂图片的弦外之音吗？多模态大模型新基准II-Bench
但是，它们真的能够像人类一样，洞悉图片中的深层含义吗?为了探讨多模型大模型与人类的差距，来自中科院深圳先进院，M-A-P，华中科技大学，零一万物，滑铁卢大学等多家机构联合提出了首个用于评估多模态大模型图像隐喻理解能力的综合性基准测试II-Bench。
不秃头程序员
年轻人的第一个多模态大模型，1080Ti轻松运行，已开源在线可玩
其实，早在去年12月Vary团队就发布了Vary的首项研究成果“Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models”。
量子位
46评论
华科大发布多模态大模型Monkey，团队称能对更大尺寸图片进行描述推理
12月11日，证券时报记者从华中科技大学获悉，该校软件学院教授白翔领衔的VLRLab团队近日发布了多模态大模型——“Monkey”（意为“猴子”）。该模型能够实现对世界的“观察”，对图片进行精确描述。
证券时报e公司
大模型行业深度分析
预计 2030 年我国 AI 大模型行业市场规模为 896.58 亿元，其中云侧大模型市场规模为 812.39 亿元，端侧大模型市场规模为 84.19 亿元。
人人都是产品经理
7评论

视频

在线举报