支持多模态吗

资讯

上海：支持多模态大模型、扩展现实、柔性感知等前沿技术赋能医疗器械设备
上海市人民政府办公厅印发《上海市发展医学人工智能工作方案（2025—2027年）》的通知，其中提出，提升医疗器械智能化水平。推动医学影像设备、可穿戴设备、医用机器人等创新医疗器械向智能化、精准化、个性化方向发展。
证券时报
1评论
英伟达计划明年上半年发布新一代人形机器人计算平台，支持多模态AI模型
当地时间12月29日，据外媒报道，英伟达将于2025年上半年正式推出下一代专用于人形机器人的小型计算机Jetson Thor。英伟达机器人技术副总裁Deepu Talla表示，物理AI和机器人技术的“ChatGPT时刻”即将到来，市场已经到达“转折点”。
澎湃新闻
1评论
北京：支持自动驾驶创新主体研发多模态融合感知技术
新京报贝壳财经讯（记者张冰）5月30日，北京市人民政府办公厅印发《北京市促进通用人工智能创新发展的若干措施》。
新京报
1评论
新壹科技亮出视频垂直大模型，支持多模态，24小时训练一个数字人
智东西7月27日报道，刚刚，新壹科技发布了国内首款聚焦视频的大模型“新壹视频大模型”，以及AIGC视频生成平台“秒创视频创作平台”，首款基于商用的数字人平台“新壹数字人平台”，此外，还发布了国内首款明星数字人祝福视频制作产品“秒祝”。
智东西
谷歌开源Gemma3：支持多模态、128K输入，部分评测好过DeepSeek V3
就在刚才，Google开源了第三代Gemma系列大模型，共包含4个不同参数规模版本，第三代的Gemma 3系列是多模态大模型，即使是最小的10亿参数规模的Gemma 3-1B也支持多模态输入。
数据学习DataLearner
5评论
钉钉 AI 震撼升级：加入多模态、工作流等能力
来源：河北网络广播电视台 3月28日，钉钉 AI 助理重磅升级，上线图片理解、文档速读、工作流等产品能力，率先探索多模态、长文本与 RPA 技术在 AI 应用的落地。基于阿里通义千问大模型，升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力。
环球网
13评论
周鸿祎谈“百模大战”：弯道超车的关键在发展多模态
周鸿祎继续称，包括360在内的搜索引擎公司，都应该抽自己耳光，因为早在多年前就开始发展大模型，但只顾解决眼前问题，忙着做场景结合，“如果那个时候有员工提出要做通用型人工智能，我想无论是周总、李总还是马总，给出的答案都是:滚一边去。”
时代周报
2评论
微软高管透露将于下周推出GPT-4，为包含视频的多模态模型
·微软德国公司的首席技术官安德烈亚斯·布劳恩透露，“我们将在下周推出GPT-4，它将是一个多模态模型，会提供完全不同的可能性——例如视频。”这项技术已经发展到基本上“适用于所有语言”，也就是说“可以用德语提问，然后用意大利语得到答案”。
澎湃新闻
8评论
四部门：加强跨领域跨模态语义对齐、4D标注、大模型标注等数据标注领域的关键技术攻关应用
每经AI快讯，1月13日，国家发展改革委等四部门发布《关于促进数据标注产业高质量发展的实施意见》。其中提出，依托国家重点研发计划、国家科技重大专项等，加强跨领域跨模态语义对齐、4D标注、大模型标注等数据标注领域的关键技术攻关应用。
每日经济新闻
商汤日日新多模态大模型评测称霸，挑战高考数学完胜
【来源：广州日报】商汤日日新多模态大模型评测称霸，挑战高考数学完胜12月19日，在权威综合评测平台OpenCompass的多模态评测中，商汤科技的日日新SenseNova多模态大模型登顶榜首。
九派教育
1评论
字节跳动即梦多模态视频生成功能将开启内测
近期，即梦AI在官方社交媒体上发布了一条新功能上线预告片。视频显示，采用了全新的多模态视频生成模型OmniHuman，用户仅需输入一张图片和一段音频，就可以生成一条生动的AI视频，有望大幅提升AI短片的制作效率和质量。
中国青年网
蚂蚁百灵大模型升级多模态能力
7月6日，在上海举行的2024世界人工智能大会（WAIC）上，蚂蚁集团公布了蚂蚁百灵大模型的最新进展：百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力，可以直接理解并训练音频、视频、图、文等多模态数据，并已深入应用于生活服务、创新医疗服务等多个领域。
上游新闻
多模态能力让AI更像人，但如何鉴别AI拟人的真实性？| 2024世界人工智能大会
原生多模态，被认为是通往AGI的必经之路。多模态大模型技术能使AI更好理解人类世界的复杂信息，也能让AI落地应用时更符合人类的交互习惯，在智能客服、自动驾驶、医疗诊断等多个领域展现出巨大应用潜力。不过，当多模态能力让AI更像人时，也会带来很多隐忧。
随申Hi

加载更多

视频

问答

GPT-4将于下周公布，多模态模型，可支持视频，百度「文心一言」下周也将发布，哪些信息值得关注？
当地时间3月9日，据德国科技媒体报道，在一场名为“AI in Focus - Digital Kickoff”的活动上，微软德国公司的首席技术官安德烈亚斯•布劳恩（Andreas Braun）透露了一个重磅消息——GPT-4将于下周正式推出，并提到了一个关键细节，GPT-4将是多
头条问答