ITBear旗下自媒体矩阵:

文心5.0正式版上线:2.4万亿参数原生全模态,多领域能力领先国际

   时间:2026-01-23 03:03:00 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

百度近日正式推出并上线了其原生全模态大模型文心5.0正式版,标志着中国在多模态人工智能领域迈出了重要一步。该模型拥有2.4万亿参数,采用创新的原生全模态统一建模技术,能够同时处理文本、图像、音频和视频等多种形式的信息输入与输出,为用户提供更加全面和智能的服务体验。

在权威基准测试中,文心5.0正式版展现了卓越的性能。其语言与多模态理解能力超越了Gemini-2.5-Pro和GPT-5-High等国际知名模型,稳居全球第一梯队。同时,该模型在图像和视频生成方面也达到了垂直领域专精模型的水平,整体技术处于世界领先地位。目前,个人用户可以通过文心APP和文心一言官网体验这一创新成果,而企业和开发者则可通过百度千帆平台进行调用。

百度集团副总裁吴甜介绍,文心5.0的技术路线与业界常见的“后期融合”方案不同,它采用统一的自回归架构进行原生全模态建模。这种架构将文本、图像、视频和音频等多源数据在同一模型框架内联合训练,使多模态特征在统一架构下充分融合并协同优化,从而实现原生的全模态统一理解与生成。这一创新技术为多模态人工智能的发展开辟了新的路径。

除了原生全模态建模技术外,文心5.0还采用了超大规模混合专家结构,具备超稀疏激活参数,激活参数比低于3%。这一设计在保持模型强大能力的同时,有效提升了推理效率,降低了计算成本。模型还基于大规模工具环境合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了智能体和工具调用能力。

在实际应用中,文心5.0展现了强大的多模理解、代码生成和创意写作能力。例如,在大会现场演示中,仅输入一段博主复刻“活了么”App教程视频,文心5.0便能自动拆解步骤,理解核心交互逻辑,并直接生成可运行的前端代码。在创意写作任务中,模型还能模拟《红楼梦》中王熙凤的语言风格,生成融合古典语境与现代商业逻辑的“大观园资产重组方案”,充分展示了其情境理解与创作能力。

为了进一步提升模型的专业性和严谨性,百度还推出了“文心导师”计划。目前,该计划已吸引835位来自科技、金融、文化、教育、医疗、能源等十余个重点行业以及数理化生文史哲等学科的专家加入。这些专家在知识传授、鉴赏评价和专业校准方面对大模型进行指导,帮助模型在逻辑严谨性、专业深度、创意质量和价值观对齐等方面不断精进。

文心5.0的上线不仅体现了中国模型厂商在多模态大模型底层的自主创新能力,也有助于提升中国AI在全球产业竞争中的技术话语权。此前,文心5.0系列模型已多次登上LMArena全球大模型竞技场,并在文本榜和视觉理解榜上位居国内第一,跻身国际第一梯队。1月15日的数据显示,文心5.0以1460分位列LMArena文本榜国内第一、全球第八,超越了GPT-5.1-High、Gemini-2.5-Pro等多款国内外主流模型。

 
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version