作者 | ZeR0编辑 | 漠影智东西11月13日报道,今日,国内视频大模型创企生数科技发布Vidu 1.5新版本。该版本全新上线“多图参考”功能,突破了“一致性”难题,具备涵盖人物、物体、环境等融合的多主体一致性能力。通过上传1~3张参考图,Vidu 1.
近日,国内AI视频工具新锐、北京生数科技旗下的文生视频大模型Vidu发布了1.5新版本,实现了“世界领先水平”的突破——官方称之为「开启视频模型的上下文时代」。这种说法,是区别此前的AI视频被视作文本/静态图像动态化的流派。现如今,Vidu模型开始理解用户提供的更多提示信息。
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
用AI制作电影,正在成为现实。12月6日,由快手可灵AI联合李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位知名导演打造的9部AIGC电影短片正式亮相,涵盖奇幻、剧情、动画等多元类型。
微软正在开源权重和样本数据,并提供了一个可视化的交互界面WHAM Demonstrator供开发者体验,开发者可以在开发人员可以在Azure AI Foundry上学习试验权重、示例数据和 WHAM Demonstrator。
温勤在工位处理AI视频。(本报记者 薛尧 摄) 2024年12月30日晚,在央视新闻主办、快手可灵AI技术支持的《AI奇妙夜》晚会上,来自厦门的AI创作者温勤,带着他和小伙伴创作的3部短片亮相。这3部AI短片主题是什么?在制作过程中又有什么挑战?
2022 年底,智能聊天机器人程序 ChatGPT 一经推出便风靡全网;不久后的 2023 年 3 月,AI 绘图工具 Midjourney V5 及其作品也在全球范围引起不小的轰动,各行各业的 “游戏规则” 也开始因 AI 悄然发生变革。
美东时间7月10日,专攻语音AI和语言识别的加州公司SoundHound宣布旗下结合了ChatGPT的AI语音助手在11个欧洲市场相关汽车品牌中上线。可以看到,无论是在科技界还是投资界,AI的风头只增不减,然而围绕AI发展路径的争论也愈演愈烈。
近日,由生数科技和清华大学联合研发的国内首个纯自研原创视频大模型 Vidu全球首发“主体参照”功能,该功能能够实现对任意主体的一致性生成,让视频生成更加稳定、可控。目前该功能面向全部注册用户免费开放。Vidu支持图生和文生视频两种能力,于7月底正式上线。