上海市人民政府办公厅印发《上海市发展医学人工智能工作方案(2025—2027年)》的通知,其中提出,提升医疗器械智能化水平。推动医学影像设备、可穿戴设备、医用机器人等创新医疗器械向智能化、精准化、个性化方向发展。
当地时间12月29日,据外媒报道,英伟达将于2025年上半年正式推出下一代专用于人形机器人的小型计算机Jetson Thor。英伟达机器人技术副总裁Deepu Talla表示,物理AI和机器人技术的“ChatGPT时刻”即将到来,市场已经到达“转折点”。
智东西7月27日报道,刚刚,新壹科技发布了国内首款聚焦视频的大模型“新壹视频大模型”,以及AIGC视频生成平台“秒创视频创作平台”,首款基于商用的数字人平台“新壹数字人平台”,此外,还发布了国内首款明星数字人祝福视频制作产品“秒祝”。
来源:河北网络广播电视台 3月28日,钉钉 AI 助理重磅升级,上线图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与 RPA 技术在 AI 应用的落地。基于阿里通义千问大模型,升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力。
周鸿祎继续称,包括360在内的搜索引擎公司,都应该抽自己耳光,因为早在多年前就开始发展大模型,但只顾解决眼前问题,忙着做场景结合,“如果那个时候有员工提出要做通用型人工智能,我想无论是周总、李总还是马总,给出的答案都是:滚一边去。”
·微软德国公司的首席技术官安德烈亚斯·布劳恩透露,“我们将在下周推出GPT-4,它将是一个多模态模型,会提供完全不同的可能性——例如视频。”这项技术已经发展到基本上“适用于所有语言”,也就是说“可以用德语提问,然后用意大利语得到答案”。
每经AI快讯,1月13日,国家发展改革委等四部门发布《关于促进数据标注产业高质量发展的实施意见》。其中提出,依托国家重点研发计划、国家科技重大专项等,加强跨领域跨模态语义对齐、4D标注、大模型标注等数据标注领域的关键技术攻关应用。
近期,即梦AI在官方社交媒体上发布了一条新功能上线预告片。视频显示,采用了全新的多模态视频生成模型OmniHuman,用户仅需输入一张图片和一段音频,就可以生成一条生动的AI视频,有望大幅提升AI短片的制作效率和质量。
7月6日,在上海举行的2024世界人工智能大会(WAIC)上,蚂蚁集团公布了蚂蚁百灵大模型的最新进展:百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力,可以直接理解并训练音频、视频、图、文等多模态数据,并已深入应用于生活服务、创新医疗服务等多个领域。
原生多模态,被认为是通往AGI的必经之路。多模态大模型技术能使AI更好理解人类世界的复杂信息,也能让AI落地应用时更符合人类的交互习惯,在智能客服、自动驾驶、医疗诊断等多个领域展现出巨大应用潜力。不过,当多模态能力让AI更像人时,也会带来很多隐忧。
当地时间3月9日,据德国科技媒体报道,在一场名为“AI in Focus - Digital Kickoff”的活动上,微软德国公司的首席技术官安德烈亚斯•布劳恩(Andreas Braun)透露了一个重磅消息——GPT-4将于下周正式推出,并提到了一个关键细节,GPT-4将是多