百度近日正式推出并上线了其原生全模态大模型文心5.0正式版,这一举措标志着国内人工智能领域在多模态技术上迈出了重要一步。该模型拥有高达2.4万亿的参数规模,通过原生全模态统一建模技术,实现了对文本、图像、音频、视频等多种信息的全面理解与生成能力,为AI应用提供了更为广阔的可能性。
除了原生全模态技术外,文心5.0还采用了超大规模混合专家结构,具备超稀疏激活参数,激活参数比低于3%。这一设计在保持模型强大能力的同时,有效提升了推理效率,为大规模应用提供了有力支持。该模型还基于大规模工具环境合成长程任务轨迹数据,并通过基于思维链和行动链的端到端多轮强化学习训练,显著提升了智能体和工具调用能力。
在应用层面,百度构建了矩阵模型和专精模型两大体系。矩阵模型面向产品级应用和通用场景快速落地,包括文心Lite模型、视频大模型和语音大模型等;专精模型则面向行业应用和垂直场景,如搜索闪电专精模型、电商蒸汽机模型、文心数字人大模型及行业大模型等。这些模型共同构成了百度AI应用的丰富生态。
在文心5.0的发布会上,百度应用模型研发部负责人贾磊分享了三项令人瞩目的技术突破。首先是基于声音Token的端到端合成大模型,该模型通过离散表示定义声音token,以MoE大语言模型建模韵律,实现了高质量的声音合成。其次是5分钟超越真人的直播技术,该技术通过对目标音色的少量采样和脸谱化妆,使合成语音具备直播带货所需的情绪、节奏与感染力。最后是实时交互数字人技术,该技术采用三态Token联动架构,实现文本、语音、视频的流式控制,具有低延迟、低成本和高表现力的特点。
为了推动大模型在产业中的落地应用,百度还推出了千帆平台。该平台专为行业落地打造,提供包括文心5.0及全场景150+SOAT模型服务在内的丰富资源。同时,千帆平台还集成了包括百度AI搜索在内的众多工具及MCP和Agent工具链,并结合数据管理和企业级服务,为企业提供全周期、稳定支持多场景业务的运行环境。这一举措显著降低了企业Agent创新门槛,加速了AI技术在各行各业的应用进程。
目前,千帆平台上已累计开发超130万个Agents,以百度独家能力“百度AI搜索”为代表的工具日均调用量已突破千万次。这些数据充分证明了百度在AI应用领域的强大实力和广泛影响力。随着文心5.0的正式上线和千帆平台的不断完善,百度正持续探索赋能行业的AI解决方案,为全球AI行业的发展贡献着中国智慧和中国力量。











