Alexis Conneau 在 2023 年 4 月加入 OpenAI,帮助 OpenAI 实现了类似于「HER」的人工智能愿景,他也参与了 GPT-4o 实时音频技术,以及下一代大模型 GPT-5 的相关研发工作中。
【环球网科技综合报道】近日,生数科技联合清华大学发布了视频大模型「Vidu」,引发了广泛关注。这一模型支持一键生成长达16秒、分辨率达1080p的高清视频内容,画面效果接近Sora,并且在多方面表现出色,包括镜头语言、时空一致性、物理模拟等方面,让人惊叹。
4月27日,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
近日,由生数科技和清华大学联合研发的国内首个纯自研原创视频大模型 Vidu全球首发“主体参照”功能,该功能能够实现对任意主体的一致性生成,让视频生成更加稳定、可控。目前该功能面向全部注册用户免费开放。Vidu支持图生和文生视频两种能力,于7月底正式上线。
7月30日,曾在今年中关村论坛期间亮相发布的首个国产纯自研视频大模型Vidu(www.vidu.studio)宣布在全球范围内上线,向公众提供服务,其开放了文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。
·国产视频大模型Vidu全球上线,开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P,生成一段4秒片段只需30秒。7月30日,国产纯自研视频大模型Vidu(www.vidu.
新京报贝壳财经讯(记者罗亦丹)4月27日,在中关村论坛未来人工智能先锋论坛上,清华大学教授、生数科技首席科学家朱军发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。在论坛现场,朱军向观众展示了Vidu生成的视频,包括戴珍珠耳环的猫、弹吉他的熊猫以及摩登女郎等。
作者 | ZeR0编辑 | 漠影智东西11月13日报道,今日,国内视频大模型创企生数科技发布Vidu 1.5新版本。该版本全新上线“多图参考”功能,突破了“一致性”难题,具备涵盖人物、物体、环境等融合的多主体一致性能力。通过上传1~3张参考图,Vidu 1.
OpenAI旗下文生视频模型Sora推出时引发的行业爆炸仿佛还在昨日,但至今Sora也未对外正式开放使用。与之相对的是国内视频大模型在2024年密集发布,虽然技术更新不断,但成品多数仍需后期人工剪辑合成,影响技术在应用端的落地速度。