亚马逊云科技近日启动了其re:Invent 2024中国行全国巡演活动,覆盖了包括北京、上海、深圳在内的多个重要城市,为企业和开发者们带来了一场技术与创新的盛宴。此次巡演的核心亮点在于亚马逊云科技在全球大会上公布的一系列创新举措,旨在通过全栈联动的方式,帮助企业更好地应用生成式AI技术,重塑云上创新的体验。
在上海站的活动中,亚马逊云科技大中华区解决方案架构总经理代闻指出,技术领域的一个普遍现实是,没有任何一个大模型能够胜任所有任务。因此,他强调,根据不同的应用场景灵活选择模型,并在多模型统筹管理下为不同智能体精准赋能,是至关重要的。
亚马逊云科技此次发布的创新主要集中在生成式AI、数据战略和云服务三大领域。在生成式AI方面,公司推出了Amazon Nova系列基础模型,并对Amazon SageMaker、Amazon Bedrock和Amazon Q等核心服务进行了强化。这些举措旨在通过降低训练和推理成本、提供更多的模型选择以及更深入的应用场景覆盖,全面加速企业应用生成式AI的创新步伐。在数据战略上,新一代Amazon SageMaker为数据、分析和AI提供了一个统一的平台,同时Amazon S3新增了Tables存储类型和元数据功能,以及无服务器分布式SQL数据库Amazon Aurora DSQL,进一步提升了用户的数据管理能力。而在云服务方面,亚马逊云科技推出了搭载Trainium2芯片的新型计算实例和专为万亿参数模型提供实时推理性能的超级服务器。
Amazon Nova系列基础模型是此次发布的一大亮点,包括Nova Micro、Nova Lite、Nova Pro和Nova Premier等多个基础模型,以及专门用于生成高质量图像的Nova Canvas和生成高质量视频的Nova Reel。这些模型在各自的智能类别中表现出色,应用成本相比Amazon Bedrock中表现最佳的模型降低了至少75%,同时还是对应类别中速度最快的模型。
代闻还提到,当前越来越多的客户不再孤立地使用不同的数据分析工具,而是将分析、机器学习和生成式AI相结合来获取洞察。为此,新一代Amazon SageMaker提供了一个新的、统一的工作室环境,让客户能够查找和访问组织中的所有数据,选择最佳工具处理各种常见数据用例,并将数据和AI项目扩展至团队内的不同角色以实现协作。
在全球大规模计算集群中,能源消耗已成为一个备受关注的问题。代闻指出,电力已成为一种稀缺资源,特别是在很多海外地区,电力和碳排放紧密相连。因此,服务器的综合成本不仅取决于价格,还包括能效表现。在规定能耗范围内提升算力,不仅有助于企业节约成本,还能减少碳排放。对于有在海外进行工作负载部署或计划开展机器学习工作负载部署的用户,他建议特别关注能效问题。
亚马逊云科技在数据中心设计方面也进行了创新,通过简化电力分配和机械系统,实现了基础设施的高可用性,减少了受电气问题影响的机架数量。创新的“液体到芯片”冷却系统结合了空气和液体冷却功能,降低了机械能耗。全新设计让每个站点提供了更多的计算能力,同时在可持续性方面取得了重要突破,如采用可再生柴油作为备用发电系统燃料,显著减少了温室气体排放。
亚马逊云科技还预发布了Amazon Trainium3芯片,该芯片采用3纳米制程工艺,计算速度提高两倍,能效提升40%以上。代闻表示,生成式AI的需求往往是由用户业务侧反向推动产生的,这种需求推动了整个技术栈的演进。此次发布的Trainium2芯片是专为生成式AI设计的原生芯片,而Amazon Bedrock和Amazon Q则分别面向大模型管理和生成式AI的场景化应用,这体现了技术创新与需求联动的趋势。