ITBear旗下自媒体矩阵:

DeepSeek模型成本揭秘:GPU支出超5亿,AI研发投入引发热议

   时间:2025-02-02 17:35:21 来源:十轮网作者:十轮网编辑:快讯团队 发表评论无障碍通道

近日,中国创业公司DeepSeek因其在人工智能领域的巨额投入引发了广泛关注和股市波动。据知名研究机构SemiAnalysis的最新报告揭示,DeepSeek在硬件绘图处理器(GPU)上的支出已超过5亿美元大关。

DeepSeek的背后推手是中国对冲基金幻方量化(High-Flyer)。据悉,幻方量化于2023年5月正式成立了DeepSeek,旨在加速AI技术的研发进程。值得注意的是,早在2021年,即任何出口管制措施生效之前,幻方量化已前瞻性地投资购入了一万颗英伟达(Nvidia)A100 GPU,为DeepSeek的后续发展奠定了坚实基础。

SemiAnalysis的报告进一步指出,DeepSeek在GPU方面的投资之巨,远超公众想象。而英伟达方面,为了遵守相关法规,已推出了多款H100的变种产品,如H800、H20等。然而,目前仅有H20型号被允许销售至中国市场。在过去九个月里,英伟达专门为中国市场生产了超过百万颗H20 GPU。据分析,DeepSeek在服务器资本支出(CapEx)方面的总投入已接近16亿美元。

DeepSeek不仅在硬件上投入巨大,同时在人才引进方面也动作频频。公司从中国本土招募了大量优秀人才,目前团队规模已迅速扩张至约150人。近期,DeepSeek因模型训练成本低于600万美元的说法而引发业界热议。然而,SemiAnalysis的报告强调,这600万美元仅指预训练运行的GPU成本,远非模型总成本的全部。研发(R&D)、硬件总拥有成本(Total Cost of Ownership)等关键因素均未计入其中。

报告还提及了DeepSeek获得大量算力资源与出口管制及时间滞后效应之间的关联。美国智库兰德公司(RAND)研究员海姆(Lennart Heim)近期分析指出,硬件出口管制存在时间滞后,其影响力尚未完全显现。未来,当数据中心需要升级或扩展时,美国企业将相对容易应对,而对于受出口管制影响的中国企业来说,这将是一个严峻挑战。

尽管面临诸多挑战,DeepSeek在人工智能领域的表现却令人瞩目。SemiAnalysis评价称,DeepSeek开放的权重模型在性能上超越了meta的Llama、法国人工智能创业公司Mistral AI等竞争对手,展现出强大的竞争力。

DeepSeek的成功不仅体现在技术上,更在于其对于未来趋势的敏锐洞察和果断行动。面对出口管制等外部压力,DeepSeek通过提前布局、加大投入等策略,确保了自身在人工智能领域的领先地位。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version