Alexis Conneau 在 2023 年 4 月加入 OpenAI,帮助 OpenAI 实现了类似于「HER」的人工智能愿景,他也参与了 GPT-4o 实时音频技术,以及下一代大模型 GPT-5 的相关研发工作中。
4月27日,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
7月30日,曾在今年中关村论坛期间亮相发布的首个国产纯自研视频大模型Vidu(www.vidu.studio)宣布在全球范围内上线,向公众提供服务,其开放了文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。
央视新闻客户端 近日,首个国产纯自研视频大模型Vidu(www.vidu.studio)全球上线,向用户开放了文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。用户直接使用邮箱注册即可上手体验,无需申请。
作者 | ZeR0编辑 | 漠影智东西11月13日报道,今日,国内视频大模型创企生数科技发布Vidu 1.5新版本。该版本全新上线“多图参考”功能,突破了“一致性”难题,具备涵盖人物、物体、环境等融合的多主体一致性能力。通过上传1~3张参考图,Vidu 1.
9月11日,国内生成式AI初创企业生数科技针对旗下Vidu AI视频平台发布“主体参照”新功能。该功能可以实现对任意人物、视觉形象主体的一致性生成,在不同环境中、不同镜头下的形象主体保持连贯一致,让AI视频生成更加稳定。目前该功能面向用户免费开放。
Vidu生成的视频截图。生数科技供图科技日报讯 (记者崔爽)记者8月3日获悉,亮相2024中关村论坛年会的人工智能视频大模型Vidu日前宣布在全球正式上线。Vidu开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。
9月11日,由生数科技和清华大学联合研发的自研原创视频大模型Vidu迎来重大更新“主体参照”(Subject Consistency)功能,该功能能够实现对任意主体的一致性生成,让视频生成更加稳定、可控。目前该功能面向用户免费开放。
·国产视频大模型Vidu全球上线,开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P,生成一段4秒片段只需30秒。7月30日,国产纯自研视频大模型Vidu(www.vidu.
OpenAI旗下文生视频模型Sora推出时引发的行业爆炸仿佛还在昨日,但至今Sora也未对外正式开放使用。与之相对的是国内视频大模型在2024年密集发布,虽然技术更新不断,但成品多数仍需后期人工剪辑合成,影响技术在应用端的落地速度。