M6(MultiModality-to-MultiModality Multitask Mega-transformer)是阿里巴巴达摩院研发的超大规模中文多模态预训练模型,2021 年推出,历经千亿、万亿至 10 万亿参数迭代,为通义大模型前身。依托阿里云 PAI 与 EPL 分布式框架,实现低碳训练与高效推理,面向企业与开发者提供多模态 AI 能力,覆盖文本、图像、跨模态生成与理解。
核心优势
参数规模领先:全球首个 10 万亿参数多模态模型,中文能力顶尖
低碳高效训练:能耗仅为 GPT-3 的 1%,算力节省超 80%,训练效率提升 11 倍
多模态统一:单一模型处理 30 + 跨模态任务,文图音视频深度融合
阿里云生态集成:无缝对接 PAI、灵杰平台,支持 SaaS 与私有化部署
产业落地成熟:电商、设计、内容创作等 200 + 场景规模化应用
亮点功能
文生图 / 图生文:高精度图像生成、图文互译,支持服装设计、海报创作
跨模态搜索与理解:图文检索、视觉问答、文档摘要、内容审核
通用文本能力:知识问答、创意写作、多语言翻译、代码生成
轻量化部署:支持百亿级轻量版本,适配端侧与低算力环境
行业定制微调:提供行业预训练模型,适配电商、制造、医疗等场景
应用场景
电商:商品图生成、详情文案创作、虚拟主播、跨模态搜索
创意设计:服饰 / 海报 / IP 设计、艺术创作、广告素材生成
内容生产:新闻摘要、自媒体文案、短视频脚本、图文排版
企业服务:智能客服、文档问答、知识管理、舆情分析
智能制造:产品设计辅助、工业图像质检、设备故障诊断
使用方法
访问官网注册登录,在线体验文生图、图文问答等功能
企业用户申请 API 接口,获取密钥后接入阿里云 PAI 平台调用
选择公有云 SaaS 服务或私有化部署,按需微调行业模型
搭配 S4 压缩框架部署轻量化版本,降低推理成本
技术价值
突破超大规模模型训练瓶颈,树立低碳 AI 行业标杆
统一多模态技术体系,降低跨模态 AI 开发门槛
赋能传统产业数字化转型,提升内容创作与设计效率
免费与定价
官网提供免费试用额度,支持基础文生图与问答体验
企业 API 调用按 token 计费,私有化部署定制报价,支持按量付费








