DeepSeek的开源之举在AI基础设施领域掀起了波澜。近日,该公司宣布开源其3FS并行文件系统,这一消息如同在平静的湖面投下了一颗巨石,激起了层层涟漪。
3FS以其卓越的数据处理能力吸引了业界的广泛关注。据悉,该系统每秒能处理6.6TB的数据量,这一速度意味着在1秒内即可传输完700部4K高清电影。更令人瞩目的是,3FS还能实现资源的自动调配,国产芯片在采用该系统后,与国际知名品牌的性能差距被大幅缩小至15%。
这一技术的推出,不仅标志着AI存储领域的一次重大突破,也揭示了存储系统在大模型训练中的重要性。随着Llama3 70B模型单次训练需消耗15PB数据的现实摆在眼前,全球AI实验室开始意识到,存储系统已成为制约AI发展的关键因素之一。以往,人们往往更多地关注GPU算力,而忽视了存储系统的瓶颈问题。
在AI算力飞速发展的当下,存储问题逐渐浮出水面,成为了一个亟待解决的“隐形战场”。一家头部AI公司曾因存储带宽不足,导致2000张A100显卡的算力利用率长期低迷,单日经济损失高达百万美元。这一案例充分暴露了AI时代的“木桶效应”,即当GPU计算速度达到极致时,存储系统的微小波动都可能引发训练任务的崩溃,导致数周的计算成果付诸东流。
存储优化对于提升AI模型训练效率至关重要。数据显示,通过存储优化,175B参数模型的训练周期可以缩短30%,从而节省数百万美元的成本。在推理端,存储延迟的波动同样会对服务质量产生重大影响。例如,当10%的异常请求遭遇存储延迟时,P99响应时间可能会瞬间突破服务等级协议(SLA)的红线,这正是某自动驾驶公司在线服务突发降级的原因。
DeepSeek自研3FS的决定,正是基于其对存储架构在AI应用中重要性的深刻认识。根据《金融行业先进AI存力报告》指出,在相同的GPU算力规模下,存储性能的高低可能导致模型训练周期存在3倍的差异。因此,在算力军备竞赛的背后,一场关于存储性能密度的较量也在悄然进行,自研存储成为了众多企业的选择。
在国内市场,能够自主研发并行存储产品的厂商并不多。小编搜集了国内外优秀的并行存储产品进行了对比,发现除了IBM、DDN等老牌存储品牌外,国内仅有少数几家厂商具备这一能力。其中,华为存储和京东云云海在业界表现突出。
IBM作为存储领域的老牌劲旅,其产品成功从高性能计算(HPC)场景向AI场景转型。然而,由于在国内市场的萎缩,其在产品研发上的投入也有所减少。DDN在全球AI场景中得到了广泛应用,其产品在读写带宽等关键性能指标上表现优异。但由于技术封闭性和专有化硬件等原因,用户的建设成本过高,限制了其在国内市场的推广。
相比之下,国产厂商DeepSeek的3FS虽然是一款新产品,但在读带宽能力上表现不俗。而另一家国产厂商京东云云海则在专业领域展现出了更强的实力。其单节点读带宽达到95GB/s,写带宽达到60GB/s,进一步拉近了国产存储与国际老牌厂商的差距。与DeepSeek的3FS相比,京东云云海在提供高性能的同时,适用性更广,能够满足包括DeepSeek、ChatGPT、LLaMA等在内的20余种主流大模型的存储需求。
随着大模型在各个领域的应用不断深入,对存储系统的要求也越来越高。DeepSeek、京东云云海等国产存储厂商在处理大规模数据集时展现出了卓越的性能。未来,国产存储能否在全球市场中拔得头筹,让我们拭目以待。