Vidu是生数科技研发的多模态大模型,专精视频生成,基于Transformer架构融合文本、图像、音视频多模态,通过扩散模型技术实现高一致性视频生成,攻克多主体一致性难题,生成16秒高清电影级画面,且在3D生成无需训练数据即可生成带纹理网格,细节优于Google、OpenAI等主流模型,已落地AI短剧、漫剧创作,全球超3000万用户,2023年完成近亿元天使轮融资由蚂蚁集团领投,2024年通过国家算法备案。
核心优势
多模态转化与融合能力:支持文本、图像、3D模型、音视频等任意模态间的转化与融合,采用Transformer架构实现统一基座。
视频生成高一致性:通过扩散模型技术实现高一致性视频生成,攻克“多主体一致性”难题,可生成16秒高清电影级画面。
3D生成无需训练数据:无需3D训练数据即可生成带纹理的三维网格,细节表现优于Google、OpenAI等主流模型。
亮点功能
16秒高清电影级视频生成:支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
5.4亿版权素材库接入:已与视觉中国合作接入5.4亿版权素材库,提升内容生成效率。
应用场景
广告:利用其视频生成能力快速制作高质量广告内容。
影视内容生成:用于AI短剧、漫剧创作,提升内容生产效率。
技术价值
生数大模型推动了AI视频生成技术的发展,通过其强大的多模态融合和视频生成能力,显著提升了内容创作的效率和质量。








