在半导体行业的聚光灯下,英伟达和AMD常常成为焦点,但2024年,博通(Broadcom)悄然崛起,成为行业的新星。
博通的股价在2024年上涨超过60%,并在12月13日飙升24%,市值突破1万亿美元,成为全球第三大半导体公司,仅次于英伟达和台积电。目前,博通的市值已超过1.1万亿美元。
点燃资本市场对博通热情的关键词是ASIC(专用集成电路)。与此同时,英伟达也在ASIC领域积极布局,自2024年中起,英伟达在台湾积极招聘ASIC设计工程师,计划开设研发中心,拟招聘超过1000人。
这一系列动作引发了一个关键问题:GPU的时代是否即将结束?是否有一种新的硬件架构将取代GPU,成为AI大模型计算的主流?
英伟达的成功之路并非一帆风顺。自1993年成立以来,英伟达凭借图形处理单元(GPU)迅速在游戏市场站稳脚跟。2006年,英伟达推出CUDA(Compute Unified Device Architecture),将GPU引入通用计算领域,为深度学习奠定了技术基础。
随着深度学习的兴起,尤其是卷积神经网络(CNN)的广泛应用,GPU的计算优势得到进一步释放。2016年,英伟达发布Volta架构,搭载Tensor Cores,专为深度学习设计,大幅提升了AI模型训练的效率。2020年,A100 Tensor Core GPU的发布,进一步巩固了英伟达在AI领域的领先地位。
然而,随着AI大模型的发展,尤其是像GPT-4这样的超大规模神经网络,GPU的局限性开始显现。内存带宽、功耗以及性能提升瓶颈成为制约GPU进一步发展的关键因素。
相比之下,ASIC针对特定任务进行优化,能够消除不必要的冗余计算,提升计算效率和能效。Google的TPU就是一个典型的例子,它专为深度学习任务设计,在矩阵乘法和卷积操作等关键步骤上表现出色。
博通和谷歌是ASIC领域的两大代表。博通通过定制化ASIC芯片,满足不同客户的高效计算需求,与谷歌的合作更是推动了TPU的发展。2024财年,博通的AI业务营收达到122亿美元,同比增长220%。
尽管ASIC在AI计算中展现出巨大潜力,但它要想真正超越GPU,仍面临诸多挑战。首先,ASIC的灵活性不足,难以快速适应AI领域的多样化需求。其次,ASIC的开发周期长、成本高,难以像GPU那样通过软件更新和架构优化来快速提升性能。最后,ASIC缺乏像CUDA那样的强大生态系统支持,难以广泛推广。
对于中国AI芯片企业而言,ASIC的出现提供了新的机遇。相较于英伟达在GPU领域的深厚壁垒,ASIC领域仍是一片“处女地”。中国AI芯片企业可以通过定制化设计,针对AI大模型训练、推理等核心任务进行深度优化,构建软硬结合的开发者生态,实现“弯道超车”。
在硬件层面,中国AI芯片企业可以借鉴Google TPU的思路,追求芯片的高度专业化。在软件层面,则需要构建与硬件相匹配的软件开发工具和平台,形成完整的生态系统。只有这样,中国AI芯片企业才能在全球竞争中占据一席之地。