在人工智能领域,一系列标志性事件正预示着一场技术革命的到来。特斯拉的Optimus机器人成功在工厂中执行零件分拣任务,宇树机器人在春晚舞台上精准展现舞蹈动作,比亚迪则引领智能驾驶技术的全民普及浪潮。这些成就不仅彰显了人工智能技术的飞速进步,更预示着人工智能正步入一个关键的发展阶段。
阿里巴巴集团CEO吴泳铭近日宣布,未来三年内,阿里将斥资超过3800亿元用于云和AI基础设施的建设,这一投资额度超过了过去十年的总和,也刷新了中国民营企业在该领域投资的历史纪录。据IDC预测,到2030年,人工智能将为全球经济贡献19.9万亿美元,推动全球GDP增长3.5%。
回顾历史,从工业革命到信息革命,每一次技术的重大飞跃都伴随着基础设施的深刻变革。如今,人工智能的蓬勃发展同样呼唤着一张全新的基础设施网络。这张网络不仅是数据传输的通道,更是连接实体与智能、协调全局与局部、平衡效率与安全的“神经中枢”。它将使机器智能与物理世界实现同频共振,开启通往通用人工智能(AGI)的新篇章。
在这张智能网络的支撑下,机器人、自动驾驶汽车、低空飞行器等智能体能够自主决策、协同控制,完成实时对话和人机交互。它们通过感知、决策到控制执行的端到端智能系统,展现出前所未有的适应性和灵活性。这一趋势正引领着人工智能从感知式AI向物理AI的深刻转变。
感知式AI作为人工智能发展的初级阶段,主要关注机器对环境的感知能力。通过视觉、听觉等感官获取信息并进行基本理解和响应,感知式AI使机器能够与外界进行初步交互。然而,当面对复杂场景时,单纯的环境感知能力往往暴露出局限性。例如,自动驾驶汽车在遭遇道路塌陷时,或服务机器人在凌乱的客厅中找不到充电接口时,便显得力不从心。
相比之下,物理AI则通过结合对物理现象的理解与智能决策能力,使智能系统能够灵活应对复杂情况。它不仅让机器能够理解信息,还能在物理世界中进行操作。例如,AI可以直接控制仓库中的机器人进行货物运输,或优化自动驾驶汽车的行驶策略。这种能力赋予了具身智能和自动驾驶更强的环境感知、理解和交互能力。
在感知式AI的基础上,生成式AI进一步发展,形成了机器生成内容的能力。这一阶段的人工智能不仅能够理解信息,还能创造文本、图像和音频等新的内容。然而,尽管生成式AI在营销和创作领域提供了前所未有的工具和可能性,但其技术天花板已逐渐显现。它依赖于统计机器学习,通过数据喂养、训练和输出结果。这种“深度思考”过程的透明化,反而让人看清了其本质——一个被训练出的智能模型,而非真正的智能体。
为了进一步提升AI理解真实世界的能力,物理AI应运而生。它不仅让机器能够“看”和“听”,还能“理解”和“行动”。这种逐步演进为实现更高级别的通用人工智能奠定了基础。例如,meta首席AI科学家杨立昆在人工智能行动峰会上强调,AI需要理解物理世界,只有在此基础上,AI才能真正接近人类智慧。
物理AI的颠覆性在于它将智能注入物理实体,让机器具备“感知-决策-执行”的闭环能力。从自动驾驶车辆到智能电网,从柔性机器人到分子级制造设备,这些系统不再满足于“理解世界”,而是致力于“改变世界”。它们通过实时处理输入信息、感知和推理环境,确保具身智能能够及时响应。
在自动驾驶领域,物理AI的应用尤为关键。现有的自动驾驶系统普遍缺乏多智能体协作能力和高效决策与解释能力。在面对复杂交通环境时,它们难以有效理解周围交通参与者的行为和意图。而物理AI则通过实时感知和推理环境,赋予自动驾驶车辆超越人类反应极限的群体决策能力。例如,当暴雨导致某路口能见度骤降时,路侧基站能在百毫秒内完成对车道行驶轨迹的预测,并向范围内的车辆发送分级制动指令。
物理AI的崛起也加速了人形机器人等领域的发展。多模态大模型作为物理AI的重要技术支撑,通过扩大信息输入模态、提升模型能力天花板,推动了物理AI向前发展。例如,Figure AI公司发布的Figure 02机器人集成了OpenAI的GPT-4o多模态大模型,使其能够更好地理解和响应复杂指令。
随着物理AI的不断发展,一张虚实融合的AI网络正在重构技术演进的底层逻辑。车路云网络作为智能体与实体世界实时交互的AI网络,通过大规模部署路侧感知单元、每秒处理海量数据的边缘计算节点以及覆盖城市道路的网络,将数字智能注入物理世界的毛细血管。这一网络不仅提升了交通效率,更证明了当AI突破数字世界边界时,其进化轨迹必然要与物理实体深度融合。
如今,从实验室中的机械臂预测咖啡杯滑落前的震颤频率,到气象AI系统同步调整风力发电机的叶片角度,这些看似碎片化的技术突破正在编织覆盖全球的智能协同网络。当这个网络达到临界规模时,或许我们终将理解图灵在1950年提出的那个终极问题:机器能否思考?答案或许正隐藏在机器与物理世界持续对话时产生的每一次电光石火之中。