4月27日,在2024中关村论坛——未来人工智能先锋论坛上,中国首个长时长、高一致性、高动态性视频大模型Vidu正式发布。首个国产视频大模型Vidu是怎么诞生的?它是我国完全自主研发的吗?Vidu目前具有哪些能力?对标Sora实力如何?
“甄嬛在后宫大吃汉堡”“等我老了依靠小猫养老”......近期,用AI大模型制作的上述视频走红网络。利用AI,有人将经典电视剧《甄嬛传》变成了“舌尖上的中国”,有人不断推出AI萌系宠物视频快速在社交媒体上成为宠物博主。 这些视频的背后,是“中国版Sora”的快速崛起。
作者 | ZeR0编辑 | 漠影智东西11月13日报道,今日,国内视频大模型创企生数科技发布Vidu 1.5新版本。该版本全新上线“多图参考”功能,突破了“一致性”难题,具备涵盖人物、物体、环境等融合的多主体一致性能力。通过上传1~3张参考图,Vidu 1.
新京报贝壳财经讯(记者罗亦丹)4月27日,在中关村论坛未来人工智能先锋论坛上,清华大学教授、生数科技首席科学家朱军发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。在论坛现场,朱军向观众展示了Vidu生成的视频,包括戴珍珠耳环的猫、弹吉他的熊猫以及摩登女郎等。
4月27日,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
不需要复杂的指令仅仅输入一段文字描述严丝合缝的代码便会为你构建起一帧帧栩栩如生的影像2024年4月媲美Sora的首个国产自研视频生成大模型Vidu出现在大众视野支持一键生成16秒、1080P的视频带领团队完成这项工作的是清华大学计算机系博士生鲍凡毕业后他即将担任AI创业公司的首席
今年春节,清华大学人工智能研究院副院长、生数科技联合创始人兼首席科学家朱军教授被OpenAI推出的视频模型Sora所惊扰。他表示,之所以说“惊扰”,一方面是惊叹于Sora所表现的突出性能,另一方面是对OpenAI未开放的技术及不确定性未来突破的担忧。