人工智能领域迎来重要进展,DeepSeek正式推出其全新系列模型DeepSeek-V4的预览版本,并同步开源相关资源。此次发布的模型在超长上下文处理能力方面实现突破,标志着AI技术向更高效、更普及的方向迈进。
DeepSeek-V4系列包含两个核心版本:性能强劲的DeepSeek-V4-Pro和经济高效的DeepSeek-V4-Flash。用户现已可通过官方网站和移动应用体验这两个版本,其最大特色是支持100万字符的超长上下文处理。这一能力得益于模型架构的创新设计——采用新型注意力机制对token维度进行压缩,并结合DSA稀疏注意力技术,在保持全球领先的长上下文处理能力的同时,显著降低了计算和显存需求。
在性能表现上,DeepSeek-V4-Pro展现出卓越实力。该版本在Agent能力方面取得显著提升,在Agentic Coding评测中达到开源模型最优水平。内部测试显示,其使用体验优于Sonnet4.5。该模型在世界知识测评中领先其他开源模型,在数学、STEM和竞赛级代码生成等推理任务中表现突出,性能可与世界顶级闭源模型媲美。
针对不同应用场景需求,DeepSeek-V4-Flash提供了更轻量化的选择。虽然其世界知识储备略逊于Pro版,但推理能力接近。在Agent任务测试中,Flash版在简单任务上与Pro版表现相当,但在处理复杂任务时仍有提升空间。这两个版本均已通过API服务更新,开发者可立即调用。
为优化代码相关任务体验,DeepSeek特别针对Claude Code、OpenClaw等主流Agent产品进行适配。目前,旧版API接口"deepseek-chat"和"deepseek-reasoner"将继续提供服务至2026年7月24日,之后将分别由deepseek-v4-flash的非思考模式与思考模式替代。
开发社区迎来重要资源开放,DeepSeek不仅开源了模型权重,还发布了详细技术报告。研究人员和开发者可通过Hugging Face和ModelScope平台获取完整资源,支持本地部署和二次开发。相关资源链接已同步公布,便于专业人士深入探索模型技术细节。










