北京智源人工智能研究院近日正式揭晓了“2025十大AI技术趋势”,涵盖了从基础设施构建到产品应用落地等多个方面,对AI的未来走向进行了深入剖析和预测。智源研究院围绕Scaling Law、基础模型、具身智能、超级应用以及AI安全等核心议题,为每一项趋势提供了详尽的论证逻辑。
在这些趋势中,尤为引人注目的是中国自研技术和产品的卓越表现。在多模态领域,智源研究院推出的原生多模态世界模型Emu3,凭借其自回归技术,成功实现了视频、图像和文本三种模态的统一理解和生成,展示了中国在AI技术研发方面的深厚实力。
在模型应用层面,豆包凭借其强大的AI功能,月活跃用户数已突破7116万,稳居国内第一、全球第二的位置,成为AI原生应用的佼佼者。同时,蚂蚁集团旗下的支小宝、蚂小财等AI管家产品,通过重塑AI产品形态,为用户带来了全新的服务体验。
AI大模型及深度数字化趋势的兴起,也进一步凸显了安全科技的重要性。智源研究院不仅致力于AI安全底层关键技术的研究,还积极推动国际合作,成功举办我国首个AI安全国际对话高端闭门论坛,并联合全球AI领袖学者及产业专家签署了《北京AI安全国际共识》。蚂蚁集团牵头制定的《大语言模型安全测试方法》也被联合国科技大会采纳为两项大模型安全标准之一。
智源研究院院长王仲远指出,当前人工智能正处于发展的新拐点,大模型的能力涌现正在加速通用人工智能时代的到来。原生统一多模态、具身智能以及AI for Science等技术将进一步深化AI对世界的感知、理解与推理,连接数字世界与物理世界,推动科学研究实现创新突破。
具体来看,AI for Science已成为推动科学研究范式变革的关键力量。随着多模态大模型在科学研究中的广泛应用,将赋能多维数据的复杂结构挖掘,辅助科研问题的综合理解与全局分析,为生物医学、气象、材料发现等基础与应用科学的研究开辟新的研究方向。同时,具身智能也将在2025年迎来更多期待,包括行业格局的洗牌、技术路线的迭代以及商业变现的拓展。
统一的多模态大模型将实现更高效的AI,通过原生多模态技术路线,实现多模态的统一,构建原生多模态大模型成为多模态大模型进化的重要方向。而基于Scaling Law的训练模式“性价比”持续下降,强化学习等技术将得到更多应用和创新使用。世界模型的加速发布有望成为多模态大模型的下一阶段,赋予AI更高级别的认知和推理能力。
在数据方面,高质量数据将成为大模型进一步发展的阻碍,而合成数据已成为基础模型厂商补充数据的首选。合成数据可以降低人工治理和标注的成本,提升数据的多样性,有助于提高模型处理复杂问题的能力,并促进大模型的应用落地。同时,推理优化迭代加速也成为AI Native应用落地的必要条件,算法加速和硬件优化技术持续迭代,共同推动AI Native应用的快速发展。
最后,更通用、更自主的智能体将重塑产品应用形态,成为大模型产品落地的重要应用形态。随着AI应用热度的持续攀升,Super App的落地已指日可待。然而,在AI技术快速发展的同时,AI安全治理体系也需持续完善,以应对大模型带来的潜在失控风险。