深思考Dongni多模态大模型由深思考人工智能机器人科技(北京)有限公司研发,基于Transformer框架构建,支持文本、图像、语音等多模态输入与输出。该模型通过无监督学习与微调技术,实现跨模态理解与生成,并集成于AI多模态搜索引擎Dongni.so中。Dongni.so作为入口级产品,提供交互式搜索与个性化服务,聚焦“智能终端”和“重疾早筛”两大垂直场景,如AI PC套件、智能显微镜等。模型通过国家互联网信息办公室备案,确保数据合规性。
核心优势
多模态融合:统一处理文本、图像、语音,提升交互灵活性。
垂直场景深耕:聚焦智能终端与医疗领域,解决行业落地难题。
端云协同:支持云端大模型与端侧轻量模型(如TinyDongni)协同部署。
亮点功能
跨模态检索:根据文本描述搜索图像,或基于图像生成描述。
实时交互:支持语音转文本、情感化语音合成,实现自然对话。
安全合规:内置敏感词过滤与内容审核机制,确保输出安全。
应用场景
智能终端:AI PC、摄像头、显微镜的实时图像分析与语音控制。
医疗健康:重疾早筛辅助诊断,如病理图像识别与报告生成。
企业服务:智能客服、多模态文档检索与内容生成。
技术价值
可解释性:提供决策溯源,增强模型可信度。
高效推理:优化计算资源需求,适配端侧设备运行。
持续迭代:基于用户反馈优化模型,提升场景适应性。








