今日,百度云智大会盛大召开,会上,百度智能云宣布了一个重要消息:其自主研发的百舸AI异构计算平台已成功升级至4.0版本,标志着百度在AI技术领域迈出了新的一步。
据ITBEAR了解,此次百舸4.0版本的重点升级在于“多芯混训”能力,实现了在万卡规模集群上高达95%的多芯混合训练效能,极大提升了AI模型的训练效率。此外,在集群部署环节,升级后的百舸平台展现了惊人的速度,能够将万卡集群的运行准备时间从数周缩短至仅需1小时,极大地节省了时间和人力成本。
针对大模型训练过程中常见的故障问题,百舸4.0也进行了全面的优化。通过升级故障检测手段和自动容错机制,百舸4.0有效降低了故障发生的频次,大幅减少了集群故障的处理时间,确保了在万卡集群上实现超过99.5%的有效训练时长。
在模型推理方面,百舸4.0也进行了整体的优化,不仅提升了推理速度,还降低了成本。特别是长文本推理效率,相较于之前版本,提升了1倍以上,为用户带来了更加高效、经济的AI应用体验。
此次百舸AI异构计算平台的升级,无疑将进一步推动百度在AI领域的发展,为行业带来更多创新和应用的可能性。
关键词:#百度智能云#、#百舸AI异构计算平台#、#多芯混训#、#模型推理#、#AI技术#