DeepSeek的火爆引发了全球算力行业的热议与关注。这款凭借算法优化大幅降低模型训练成本的大模型,不仅采用了MoE架构和动态路由算法等先进技术,还通过开源策略迅速在垂直领域取得了显著渗透,全球日活用户量在短短一个月内从34.7万激增至1.19亿。
面对DeepSeek带来的算力需求激增,众多算力行业厂商纷纷宣布适配,其中包括昇腾、天数智芯、摩尔线程等知名企业。然而,国产芯片厂商的适配工作仍处于初级阶段,要达到更底层的算法适配,还需在FP8混合精度、多场景功耗平衡以及软硬协同深度优化等方面持续投入。
DeepSeek的火爆不仅推动了算力需求的增长,还引领了大模型发展的两大趋势:技术摸高与工程创新。在技术摸高方面,头部企业加大投入,加速探索AGI,关注高效、稳定的AI底座和生态。例如,meta和谷歌分别大幅增加了AI领域的投资,同时发布了新的模型版本。
而在工程创新方面,新的范式降低了后训练和蒸馏的门槛,引发了新一波的模型多样化发展。企业更加关注便捷、易用、性价比高的平台,以及高效的部署和敏捷业务上线。DeepSeek的火爆使得企业纷纷以冲刺方式接入,以获取流量优势。自发布以来,已有160多家企业集体接入DeepSeek。
在消费端,DeepSeek也呈现出爆炸式增长,超级APP的快速出现加速了LLM的全面普及。DeepSeek不仅提升了社会对LLM的认知,还促进了新商业模式的成型,实现了商业正循环。为了满足大模型算力需求,业界在模型结构优化、计算通信优化、后训练优化以及推理优化等方面都取得了显著进展。
华为昇腾在DeepSeek适配方面取得了显著成果。昇腾是业界首个适配完成DeepSeek核心算法,并支持全系模型预训练及微调的芯片平台。昇腾超节点支持DeepSeek的核心优化技术,如DualPipe和跨节点All2All等,超大带宽通信域更适合DeepSeek的流水线并行算法及冗余专家等能力。
昇腾还是业界唯一从预训练到微调全流程适配DeepSeek的AI训练平台。随着行业模型训练方式的演进,昇腾提供了DeepSeek R1模型及强化学习算法,结合提示工程及数据采样,可生成大量高质量合成数据。昇腾还与众多伙伴合作,推出了一体机、云服务、硬件+开源社区等产品形态,帮助企业快速部署。
据了解,目前已有80多家客户/伙伴基于昇腾快速适配/上线DeepSeek系列模型并对外提供服务,另有20多家企业正在进行适配测试,预计两周内全部上线。昇腾在DeepSeek适配方面的领先地位,无疑为国内企业快速上线DeepSeek提供了有力支持。