DeepSeek近日宣布推出实验性版本模型DeepSeek-V3.2-Exp,该版本在原有V3.1-Terminus架构基础上进行了关键技术升级。此次更新引入了自主研发的DeepSeek Sparse Attention稀疏注意力机制,重点针对长文本场景下的训练与推理效率展开优化验证,标志着新一代模型架构研发迈出重要步伐。
技术团队透露,V3.2-Exp在保持与前代模型相当性能水平的同时,显著提升了长文本处理能力。经公开评测集验证,新模型在各领域基准测试中的表现与V3.1-Terminus基本持平,但资源消耗效率得到明显改善。目前该模型已通过Huggingface与魔搭社区实现开源,供全球开发者研究使用。
伴随模型升级,DeepSeek同步调整了API服务定价策略。开发者调用接口的成本将下降超过50%,这一调整旨在降低技术创新门槛,促进AI技术在更多场景的落地应用。官方应用程序、网页端及小程序均已完成版本更新,用户可即时体验新模型特性。