Vidu大模型

多模态大模型，专精视频生成

分类：大模型
标签：CN
收录：2025-12-12
访问：
更新：2026-02-28

Vidu是生数科技研发的多模态大模型，专精视频生成，基于Transformer架构融合文本、图像、音视频多模态，通过扩散模型技术实现高一致性视频生成，攻克多主体一致性难题，生成16秒高清电影级画面，且在3D生成无需训练数据即可生成带纹理网格，细节优于Google、OpenAI等主流模型，已落地AI短剧、漫剧创作，全球超3000万用户，2023年完成近亿元天使轮融资由蚂蚁集团领投，2024年通过国家算法备案。

Vidu大模型官网 - 截图

核心优势

‌多模态转化与融合能力‌：支持文本、图像、3D模型、音视频等任意模态间的转化与融合，采用Transformer架构实现统一基座。
‌视频生成高一致性‌：通过扩散模型技术实现高一致性视频生成，攻克“多主体一致性”难题，可生成16秒高清电影级画面。
‌3D生成无需训练数据‌：无需3D训练数据即可生成带纹理的三维网格，细节表现优于Google、OpenAI等主流模型。

亮点功能

‌16秒高清电影级视频生成‌：支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
‌5.4亿版权素材库接入‌：已与视觉中国合作接入5.4亿版权素材库，提升内容生成效率。

应用场景

‌广告‌：利用其视频生成能力快速制作高质量广告内容。
‌影视内容生成‌：用于AI短剧、漫剧创作，提升内容生产效率。

技术价值

生数大模型推动了AI视频生成技术的发展，通过其强大的多模态融合和视频生成能力，显著提升了内容创作的效率和质量。

关键词：生数大模型, Vidu模型, 多模态视频生成, 无需3D训练数据3D生成

相关推荐

火山方舟

字节火山引擎出品的企业级一站式大模型服务平台（MaaS）

盘古大模型

华为云推出的面向行业的大模型

有道智云AI开放平台

网易有道旗下一站式AI能力开放平台

千帆大模型平台

提供全球领先的人工智能、大数据和云计算服务

昇思MindSpore

华为开源自研AI深度学习框架

百川大模型

可以和人类进行自然交流、解答问题、协助创作

曹植大语言模型

垂直领域大语言模型

天壤小白

大模型应用全栈开发平台