K2(GeoLLaMA)是上海交通大学 Acemap 团队开发的 7B 参数开源语言模型,基于 LLaMA 进一步预训练而成。它通过地球科学文本语料(含 39 亿 tokens)进行领域适配,结合 GeoSignal 指令微调数据提升性能。模型以两部分形式发布:符合 LLaMA 许可的 delta 权重和 PEFT(LoRA)适配器权重,还配套 GeoBench 评估基准及预处理工具 sciparser,为地球科学领域提供专用 AI 工具。
核心优势
专注地球科学领域,经高质量领域语料训练,知识针对性强;
开源可访问,提供完整训练、微调及评估代码工具链;
基于成熟 LLaMA 架构优化,兼顾性能与部署灵活性,支持 8 位量化加载。
亮点功能
具备地球科学专业知识问答能力,可解答板块构造、气候变化等领域问题;
提供完整技术栈,包括数据预处理、模型训练、生成推理及评估流程;
支持 LoRA 轻量化微调,降低领域适配门槛,便于二次开发。
应用场景
地球科学领域学术研究辅助,如文献解析、假设验证
地质、气候等相关学科教学支持,解答专业知识点
地球科学数据处理与分析,辅助生成解读报告
地质灾害、环境变化等问题的初步分析与预测支持
技术价值
为地球科学领域提供首个专用大语言模型及评估基准,推动 AI 技术在该领域的应用落地;开源方案降低了领域大模型研发门槛,为跨学科融合提供技术参考,同时其训练与微调方法可为其他专业领域模型开发提供借鉴。








