BlueLM 是由 vivo AI 全球研究院自主研发的大规模预训练语言模型,本次发布包含 7B 基础 (base) 模型和 7B 对话 (chat) 模型,同时我们开源了支持 32K 的长文本基础 (base) 模型和对话 (chat) 模型。
核心优势
更大量的优质数据:高质量语料库进行训练,规模达到了 2.6 万亿 的 token 数,该语料库包含中文、英文以及少量日韩数据;
更优的效果:其中 BlueLM-7B-Chat 在 C-Eval 和 CMMLU 上均取得领先结果,对比同尺寸开源模型中具有较强的竞争力;
长文本支持:BlueLM-7B-Base-32K 和 BlueLM-7B-Chat-32K 均支持 32K 长文本,在保持基础能力相当情况下,能够支持更长上下文理解;
能力介绍
内容创作:出色的文字创作能力
知识问答:生活常识/工作技能快速获取
逻辑推理:进行思维、常识、科学推理
代码生成:专业性的代码生成能力
信息提取:强大的语言理解能力
应用场景
学习
阅读
办公
协作
生活
能力基石
海量的数据:海量的数据、语料支撑,模型表现 “聪颖”、“灵敏”、“可靠”
安全合规:大语言模型安全能力和独立审核接口双重保障,输出的结果安全合规
高效的算法:顶尖的算法团队,提供业内领先的技术服务和解决方案
丰富的场景:全链路自研,在多场景下拥有国内领先的模型效果,模型持续快速迭代








