人工智能领域再掀价格战波澜,DeepSeek近日连续对旗下大模型API服务进行大幅调价。继前一日宣布V4-Pro模型限时2.5折优惠后,该平台于次日晚间再度推出全系降价方案,将输入缓存命中价格降至原有水平的十分之一,其中Pro版本叠加优惠后实际成本低至0.025元/百万Tokens,较国际头部厂商同类产品价格差距扩大至七百分之一。
根据最新定价策略,面向高速场景的V4-Flash模型每百万Tokens输入缓存命中价格仅需0.02元,而企业级V4-Pro模型在2026年5月5日前可享受双重优惠:输入缓存命中价从1元降至0.1元后,再叠加2.5折优惠至0.025元。未命中缓存的输入输出价格也同步下调,分别从12元降至3元、24元降至6元。此次调价使得高频调用场景的成本降幅超过90%,特别利好RAG知识库、智能客服等缓存命中率高的应用领域,相关企业商用成本呈现断崖式下跌。
技术突破为降价提供支撑。4月24日正式开源的V4预览版在Agent能力、世界知识掌握和推理性能三大核心指标上达到国内领先水平,其Pro版本通过优化算力架构实现显著降本——单token算力消耗仅为V3.2的27%,KV缓存需求降至10%。该模型同时支持100万token超长上下文处理,在OpenRouter平台上的调用量已现爆发式增长,4月25日单日调用量达136亿Token,较前一日激增近四倍。
价格战背后暗藏算力生态布局。在OpenAI于4月23日发布GPT-5.5 Pro(输入定价30美元/百万Tokens)的三天后,DeepSeek不仅推出超低价方案,更完成对华为昇腾NPU的深度适配,成为首个在官方技术文档中明确支持国产AI芯片的万亿参数大模型。技术报告显示,其细粒度专家并行方案已同时在英伟达GPU和昇腾NPU完成验证,这与昇腾950超节点即将批量上市的时间节点形成战略呼应。
行业观察人士指出,当前全球AI服务呈现明显分化:OpenAI、Anthropic等企业纷纷上调资费标准,谷歌推行多档位按需定价,而DeepSeek选择逆势压低行业价格预期。上海财经大学专家分析认为,此举旨在快速扩大用户基数,特别是吸引企业客户和开发者群体。不过平台方也坦言,受高端算力供应限制,当前Pro版本服务吞吐量有限,预计随着国产算力设备大规模部署,价格仍有进一步下探空间。
值得注意的是,此次降价潮正值全球AI竞赛白热化阶段。国际厂商通过提升模型复杂度维持溢价能力,而中国厂商则依托本土化优势和硬件生态协同构建价格壁垒。随着昇腾950超节点等国产算力基础设施的完善,AI服务市场的竞争格局或将迎来新一轮洗牌。











