DeepSeek V3.2发布:引入稀疏注意力机制,API调用成本大幅降低

2025-09-30 会用AI导航

9月29日,DeepSeek正式发布其最新实验性模型DeepSeek-V3.2-Exp。作为迈向新一代架构的关键中间步骤,该模型在V3.1-Terminus版本的基础上,创新性地引入了DeepSeek Sparse Attention(稀疏注意力机制,DSA),实现了长文本训练和推理效率的显著提升。

稀疏注意力机制:效率与效果的双重优化

DeepSeek-V3.2-Exp首次实现了细粒度稀疏注意力机制,这一创新技术能够在几乎不影响模型输出效果的前提下,大幅优化长文本处理的效率。通过严格的训练设置对齐,V3.2-Exp在各领域公开评测集上的表现与V3.1-Terminus基本持平,证明了新机制在提升效率的同时,也保持了高度的准确性。

DeepSeek-V3.2-Exp推理对比.jpg

开源与论文同步公开,推动社区研究

为了促进AI技术的共享与发展,DeepSeek-V3.2-Exp模型已在Huggingface与魔搭平台全面开源,同时,相关研究论文也已同步公开。用户可通过以下链接获取模型资源及详细论文内容:

API成本大幅降低,助力开发者

得益于新模型服务成本的有效控制,DeepSeek官方宣布API价格大幅下调,新价格政策即刻生效。开发者调用DeepSeek API的成本将降低50%以上,这一举措无疑将为AI应用的开发带来更大的灵活性和成本效益。目前,API的模型版本已更新为DeepSeek-V3.2-Exp,访问方式保持不变,方便开发者快速接入。

DeepSeek-V3.2-Exp.jpg

对比测试接口保留,诚邀用户反馈

为确保新模型在真实使用场景中的稳定性和有效性,DeepSeek为V3.1-Terminus临时保留了额外的API访问接口,用户可通过简单修改base_url即可访问并进行对比测试。该接口将保留至北京时间2025年10月15日23:59,调用价格与V3.2-Exp相同。DeepSeek诚挚邀请广大用户体验测试新模型,并通过反馈链接提供宝贵意见,共同推动模型的持续优化与发展。反馈链接:https://feedback.deepseek.com/dsa

DeepSeek V3.2-Exp的发布,不仅展示了DeepSeek在AI技术领域的持续创新能力,更为广大开发者提供了高效、低成本的AI解决方案。随着新模型的广泛应用和反馈收集,我们有理由相信,DeepSeek将在未来推动AI技术迈向新的高度。

官方公告:https://mp.weixin.qq.com/s/6hKi5F_S2zQ4g6SyF0UNow

评论