Vidu大模型

多模态大模型,专精视频生成

  • 分类:大模型
  • 标签:CN
  • 收录:2025-12-12
  • 访问:
  • 更新:2025-12-12

Vidu是生数科技研发的多模态大模型,专精视频生成,基于Transformer架构融合文本、图像、音视频多模态,通过扩散模型技术实现高一致性视频生成,攻克多主体一致性难题,生成16秒高清电影级画面,且在3D生成无需训练数据即可生成带纹理网格,细节优于Google、OpenAI等主流模型,已落地AI短剧、漫剧创作,全球超3000万用户,2023年完成近亿元天使轮融资由蚂蚁集团领投,2024年通过国家算法备案。

Vidu大模型官网 - 截图

核心优势

  • ‌多模态转化与融合能力‌:支持文本、图像、3D模型、音视频等任意模态间的转化与融合,采用Transformer架构实现统一基座。

  • ‌视频生成高一致性‌:通过扩散模型技术实现高一致性视频生成,攻克“多主体一致性”难题,可生成16秒高清电影级画面。

  • ‌3D生成无需训练数据‌:无需3D训练数据即可生成带纹理的三维网格,细节表现优于Google、OpenAI等主流模型。

亮点功能

  • ‌16秒高清电影级视频生成‌:支持一键生成长达16秒、分辨率高达1080P的高清视频内容。

  • ‌5.4亿版权素材库接入‌:已与视觉中国合作接入5.4亿版权素材库,提升内容生成效率。

应用场景

  • ‌广告‌:利用其视频生成能力快速制作高质量广告内容。

  • ‌影视内容生成‌:用于AI短剧、漫剧创作,提升内容生产效率。

技术价值

生数大模型推动了AI视频生成技术的发展,通过其强大的多模态融合和视频生成能力,显著提升了内容创作的效率和质量。

关键词:生数大模型, Vidu模型, 多模态视频生成, 无需3D训练数据3D生成

相关推荐