本报记者 李静 深圳报道自今年年初 OpenAI的Sora惊艳亮相之后,视频生成大模型就备受业界关注。虽然Sora至今尚未对外公测,但在中国国内却因此掀起了一波不小的视频生成大模型的竞赛,一些大厂和创业公司纷纷加入其中。
豆包视频生成模型发布现场。江佳玲摄人民网深圳9月24日电(江佳玲)9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,现场发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。据介绍,此前视频生成模型大多只能完成简单指令。
界面新闻记者 | 肖芳界面新闻编辑 | 宋佳楠2月28日,界面新闻从多个知情人士处获悉,字节跳动正在AI大模型领域秘密研发多个产品,其中包括多模态数字人产品以及AI生图、AI生视频产品等。据一位知情人士透露,其在去年下半年见到了字节跳动多模态数字人产品的demo,整体感觉还不错。
OpenAI发布的视频大模型Sora后,国内厂商迅速跟进,相继发布视频模型产品,包括生数科技、智谱AI、阿里等。9月24日,字节跳动旗下火山引擎发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,以及豆包音乐大模型、同声传译模型等产品。
文/张德帅AI视频生成领域迎来了又一重大里程碑事件。9月24日,火山引擎AI创新巡展在深圳举行。会上,火山引擎发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款视频生成大模型,面向企业市场开启邀测。
5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。据介绍,火山引擎是字节跳动旗下云服务平台,据火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。
界面新闻记者 | 肖芳界面新闻编辑 | 文姝琪2月20日,界面新闻从知情人士处获悉,在OpenAI发布Sora之前,字节跳动低调推出了一款视频模型产品Boximator。Boximator可以通过文本控制生成视频中人物或物体的动作。
界面新闻记者 | 肖芳界面新闻编辑 | 宋佳楠当其他大模型公司仍沉浸于拼参数量、拼文本长度时,字节跳动却率先打响了价格战。5月15日,字节跳动正式对外发布豆包大模型,同时公布了足以影响行业的大模型使用价格。其中,豆包通用模型pro-32k版,模型推理输入价格仅为0.
5月中旬,OpenAI、谷歌和字节跳动三大科技巨头相继公布AI业务最新进展,“画风”却差异巨大。OpenAI的发布会仅仅持续26分钟,CEO奥特曼甚至没有露面,却拿出了效果震撼的语音大模型GPT-4o。