百度在云智大会上隆重推出了其AI基础设施产品的最新版本,包括百舸AI异构计算平台4.0和千帆大模型平台3.0,并分享了一系列AI相关业务的最新进展。其中,文心大模型的日均调用量已突破7亿次,相较之前公布的6亿数据实现了显著提升。
百度集团执行副总裁、百度智能云事业群总裁沈抖强调,百舸4.0不仅具备万卡集群的能力,更进一步实现了10万卡集群的高效部署和管理。这一成就与阿里云近期宣布的单网络集群扩展至10万卡级别形成了有力竞争。
据ITBEAR了解,百度今年持续聚焦大模型的落地应用,百度CEO李彦宏在内部讲话中指出,那些具备应用场景并能持续迭代升级的大模型,与其他模型产品的差距将进一步拉大。为此,百度携手长安汽车、三星等多家知名企业,共同展示了大模型在各行各业的广泛应用成果。
沈抖透露,过去一年中,百度客户对于模型的需求急剧增长,所需的集群规模不断扩大,同时企业对于降低模型推理成本的期望也越来越高。他进一步介绍,百舸4.0能够将集群的组建时间缩短至最快1小时,这主要得益于将业界流行的训练工具和框架进行内置的优化措施。
为了应对大模型训练过程中的故障问题,百舸4.0对故障检测手段和自动容错机制进行了全面升级。目前,万卡集群上的有效训练时长已达到99.5%,这一数据表现优于行业同类产品。此外,百舸4.0还将主流的长文本推理效率提升了一倍以上,并有效降低了推理成本。
在百度最新的财报电话会上,李彦宏透露,二季度百度智能云AI贡献的收入占比已提升至9%,相较于上一季度的6.9%有了显著增长。对于百度而言,模型落地的实际成果比单纯的性能提升更具现实意义。
除了百舸平台的升级,百度还重点介绍了千帆3.0平台。该平台上的文心大模型日均调用量已超过7亿次,累计帮助用户精调了3万个大模型,并开发出70多万个企业级应用。千帆3.0平台可调用包括文心系列大模型在内的近百个国内外大模型,同时也支持调用语音、视觉等传统小模型。
当前,大模型落地的三大主要需求分别是应用开发、模型推理和模型开发。在应用开发层面,企业级RAG和Agent智能体是两大常见的大模型落地场景。智能体能够自主思考、任务拆解、方案规划,并调用工具,全程自主完成,实现了过往需要多个APP才能完成的任务。
李彦宏认为,智能体是大模型发展的下一个重要方向。百度在今年的Create大会上发布了多款与智能体相关的产品,并透露智能体在百度生态的分发量大幅增长,7月日均分发次数超过800万次,为5月数据的两倍。
此外,百度旗下数字人平台和智能客服产品也取得了最新进展。曦灵数字人平台4.0支持快速生成不同妆造和行业特色的3D数字人形象和视频,并将3D超写实数字人的价格大幅降低。智能客服产品“客悦”则在用户意图理解、多模态信息交流等方面进行了优化,提升了处理复杂问题的能力。
关键词:#百度# #大模型# #AI基础设施# #智能体# #文心大模型#