近年来,算力已成为制约国内AI发展的关键因素。为解决这一瓶颈,尤其是ChatGPT问世后,智算中心如雨后春笋般在全国涌现,成为AI时代的新基建。
智算中心,作为高阶的计算中心,相较于传统算力中心,在硬件上使用GPU替代CPU,软件层面则部署AI框架,以优化算力效率。据统计,截至今年上半年,全国已有超过250个智算中心建成或在建,仅今年前七个月,就有140个新项目中标。参与建设的不仅有城投、运营商、金融企业和央国企,还有大型互联网云计算公司如华为云、阿里云、腾讯云,甚至一些从房地产等行业跨界而来的企业。
然而,尽管智算中心建设风起云涌,但另一组数据却揭示出隐忧:IDC指出,通用算力中心的利用率仅为10%-15%,一些重量级的智算中心甚至处于闲置状态。这意味着,动辄数十亿甚至上百亿的投资并未充分发挥其价值,成为AI热潮中的新难题。
智算中心的建设周期短,通常以预制模块化机房和整柜交付方式进行,能在短时间内建成。例如,武汉首个智算中心仅用了6个月时间,一期建设规模达到100P FLOPS的AI算力,算力峰值性能相当于5万台高性能PC机。此后,从地方主导的项目到大厂投资运营,智算中心的投入资金和算力规模均呈上升趋势。
智算中心的兴起也催生了一个新的风口赛道——算力租赁。算力租赁允许企业在需要强大算力时,通过租用而非购买昂贵的计算设备来满足需求。服务商根据客户需求搭建计算环境或系统,并通过签订合同的方式提供算力服务。算力租赁的收费方式多样,包括按小时、按算力规模、按使用量和套餐计费,以适应不同客户的需求。
算力租赁市场的迫切需求主要源于模型训练。大模型训练、微调、推理需求急剧增加,但AI应用在不同开发阶段对算力的需求不同。算力租赁成为大多数大模型厂商的最佳选择,因为租赁可以降低设备采购、租金成本以及调试、维护成本和工程师研发时间成本。然而,算力租赁市场竞争格局分散,传统云服务提供商对外租赁比例较少,而具备IDC建设运营能力的企业和跨行企业越来越多。
尽管国内算力投入规模已接近全球顶尖水平,但面向AI、高性能计算的算力缺口仍然存在。赛迪顾问数据显示,2023年国内智能算力需求达123.6EFLOPS,但供给仅有57.9EFLOPS。算力需求未被云计算大厂完全承接,主要是因为大模型训练需要高性能GPU集群,而大厂提供的多是单节点服务,无法满足需求。因此,算力租赁公司有了发展空间,毛利率约为40%左右,净利率约为20%左右,但资金门槛较高。
然而,涉足算力租赁的企业普遍面临增收不增利的困境。尽管一些企业因“算力”概念股价上涨,但算力租赁市场仍存在诸多不确定性,如市场需求、政策变化、技术水平以及交付和供应链等。智算中心并非简单购买GPU就能躺赚,还需要高性能的硬件部署和软件层面的优化协调。训练算力的租赁对象主要是大模型公司,跨行企业如何获取这些客户资源也是一大挑战。
智算中心ROI过低的原因除了供需不匹配外,还包括盲目投入建设、软件能力不够导致用卡效率不高等问题。智算中心不景气直接影响算力租赁市场的低迷,一些企业因缺乏应用场景而闲置算力资源,造成浪费。国产替代过程中最难解决的是应用生态问题,封闭性导致可用的开源软件和商用软件极少,用户自有软件的迁移适配成本极高。