商汤日日新大模型

商汤科技推出的多模态大模型体系

  • 分类:大模型
  • 标签:CN
  • 收录:2025-12-09
  • 访问:
  • 更新:2025-12-09

商汤「日日新」是商汤科技自2023年起发布的大模型体系,包含语言、内容生成、多模态等模型,旨在通过“大模型+大算力”推进AGI发展。 其最新版本「日日新V6.5」在文本推理、多模态交互等核心指标上超越GPT-4 Turbo、Gemini 2.5 Pro等国际顶尖模型,是国内首个实现图文交错思维的商业级大模型。

商汤日日新大模型官网 - 截图

核心优势

  • ‌强推理能力‌:多模态思维链技术实现图文交错推理,性能国际领先。

  • ‌高性价比‌:多模态架构优化,推理成本降低3倍以上。

  • ‌端云协同‌:端侧模型(如SenseChat Lite)实现高效离线推理,云端大模型提供强大算力支持。

亮点功能

  • ‌多模态生成‌:支持文本、图像、视频、3D场景的生成与理解。

  • ‌智能体开发‌:提供数据分析、自动化标注等工具,支持端到端场景落地。

  • ‌端侧部署‌:轻量级模型在手机等设备上实现流畅的离线文本生成与多模态处理。

应用场景

  • ‌企业服务‌:智能客服、数据分析、自动化文档处理。

  • ‌内容创作‌:AI绘画、视频生成、3D内容制作。

  • ‌移动应用‌:手机端离线文本总结、图像编辑、实时交互。

技术价值

  • ‌大算力支撑‌:基于SenseCore AI大装置(2.7万块GPU,5.0 exaFLOPS算力),支持万亿参数模型训练。

  • ‌训练优化‌:采用BMTrain并行技术,训练效率提升8倍,支持长文本(16k tokens)处理。

  • ‌评测体系‌:配套天秤(FlagEval)评测体系,覆盖600+维度多模态场景评估。

关键词:商汤日日新,日日新大模型,商汤AI,多模态大模型,大模型应用,智能体开发,端侧AI,大模型评测

相关推荐