TRELLIS 3D AI 是一款免费工具,可以将任何图像转换为专业的3D资产。它采用先进的人工智能技术,包括结构化潜变量(SLAT)和视觉编码器,生成具有生动纹理和结构完整性的详细3D模型。该平台支持多种输出格式(GLB和3D高斯),并提供基于浏览器的预览和本地编辑功能,是图像到3D资产转换的全面解决方案。
TRELLIS 3D 的核心技术
TRELLIS 3D 的核心是其结构化潜空间(SLAT)表示,这是一个用于创建 3D 资产的统一框架。通过将稀疏的 3D 网格结构与稠密的多视角视觉特征相结合,TRELLIS 同时捕捉 3D 对象的几何(结构)与视觉(外观)属性。这种独特的融合,使 TRELLIS 能生成既真实又灵活的高质量 3D 对象,且在输出格式与可编辑能力上富有弹性。
校正流 Transformer(Rectified Flow Transformers) 的引入,是应对 SLAT 模型稀疏性的关键。借助这一能力,系统可以生成多种形式的逼真 3D 资产,包括 3D 高斯(3D Gaussians)、辐射场(Radiance Fields)以及网格模型(Meshes)。整个 AI 流程最多使用达 20 亿个参数,并在包含 50 万个多样化 3D 对象的海量数据集上进行训练,从而在灵活性、质量与精度之间取得平衡。
多样性与通用性
TRELLIS 的一大亮点是其在生成不同类型 3D 资产方面展现出的多样性。无论是游戏中的简单物件,还是复杂精致的 3D 艺术品,TRELLIS 都能胜任。主要体现在:
文本到 3D 生成(Text-to-3D):你可以输入文本提示(例如:“具有复杂细节的复古铜质旋转电话”),系统会将其转换为 3D 模型。此功能由 GPT-4 提供支持,确保生成结果既贴合语义又富有创造力。
图像到 3D 生成(Image-to-3D):TRELLIS 同样支持将图像转换为 3D 资产。通过利用 DALL-E 3 及其他先进的图像生成技术,系统可直接根据图像提示创建 3D 模型,进一步提升创作自由度。
资产变体与局部编辑:TRELLIS 的另一创新之处在于,它能够为现有 3D 模型生成多种变体。比如,只需提供合适的文本提示,你就可以为物体添加粗犷的金属质感,或赋予其通透的玻璃结构。同时,你还可以对 3D 资产进行局部编辑,例如移除机甲的手臂,或将双腿替换为履带式底盘,从而实现高度个性化的 3D 设计。
在艺术与设计中的应用
得益于其可生成高质量 3D 资产的能力,TRELLIS 不仅面向开发者与设计师,同样也是艺术家的强力工具。借助其强大的资产生成与操作能力,艺术家可以轻松创作出鲜活而复杂的 3D 艺术作品。对于希望突破 3D 艺术创作边界的人而言,TRELLIS 价值非凡。
工作原理:方法论
TRELLIS 的高效性来源于其SLAT 框架。该框架将稀疏结构与从预训练视觉模型中提取的稠密视觉特征相结合,并对非空单元格生成潜向量,从而同时准确捕获几何与纹理信息。得益于校正流 Transformer 的应用,TRELLIS 能处理大规模数据集并满足多样的资产需求,推动 3D 生成能力的边界。
TRELLIS 采用两阶段流水线:
先生成 3D 对象的稀疏结构;
再为非空单元格填充细节信息,完成资产构建。
这样的流程既具可扩展性,又保有灵活性,使 TRELLIS 能够胜任各类 3D 资产创作场景。
总结:为何 TRELLIS 引领 3D 生成的未来
TRELLIS 3D 在 3D 资产生成领域实现了重要的跃迁。凭借 文本到 3D 生成、图像到 3D 转换 与 局部编辑 等能力的独特组合,TRELLIS 提供了前所未有的灵活性与质量。无论你是开发者、设计师还是艺术家,TRELLIS 都能为你提供构建精彩且可高度定制的 3D 资产所需的工具。








