K2大模型

面向地球科学的开源大语言模型

  • 分类:大模型
  • 标签:
  • 收录:2025-12-23
  • 访问:
  • 更新:2025-12-23

K2(GeoLLaMA)是上海交通大学 Acemap 团队开发的 7B 参数开源语言模型,基于 LLaMA 进一步预训练而成。它通过地球科学文本语料(含 39 亿 tokens)进行领域适配,结合 GeoSignal 指令微调数据提升性能。模型以两部分形式发布:符合 LLaMA 许可的 delta 权重和 PEFT(LoRA)适配器权重,还配套 GeoBench 评估基准及预处理工具 sciparser,为地球科学领域提供专用 AI 工具。

K2大模型官网 - 截图

核心优势

  • 专注地球科学领域,经高质量领域语料训练,知识针对性强;

  • 开源可访问,提供完整训练、微调及评估代码工具链;

  • 基于成熟 LLaMA 架构优化,兼顾性能与部署灵活性,支持 8 位量化加载。

亮点功能

  • 具备地球科学专业知识问答能力,可解答板块构造、气候变化等领域问题;

  • 提供完整技术栈,包括数据预处理、模型训练、生成推理及评估流程;

  • 支持 LoRA 轻量化微调,降低领域适配门槛,便于二次开发。

应用场景

  • 地球科学领域学术研究辅助,如文献解析、假设验证

  • 地质、气候等相关学科教学支持,解答专业知识点

  • 地球科学数据处理与分析,辅助生成解读报告

  • 地质灾害、环境变化等问题的初步分析与预测支持

技术价值

为地球科学领域提供首个专用大语言模型及评估基准,推动 AI 技术在该领域的应用落地;开源方案降低了领域大模型研发门槛,为跨学科融合提供技术参考,同时其训练与微调方法可为其他专业领域模型开发提供借鉴。

关键词:K2, GeoLLaMA,地球科学大语言模型,上海交通大学 Acemap,地质 AI 模型,开源地理语言模型,GeoSignal,GeoBench

相关推荐