在人工智能领域,斯坦福大学计算机科学教授吴恩达提出了一项引人深思的“二八定律”,即80%的数据加上20%的模型,能够打造出更出色的AI系统。他强调,数据准备在AI项目中占据了绝大部分工作,确保数据质量成为团队的首要任务。这一观点在智能驾驶领域同样具有深远意义。
智能驾驶技术,如同一道诱人的佳肴,但车企要想品尝到它的美味并不容易。除了数据作为基本食材外,还需要强大的算力作为燃料,以及算法作为烹饪技巧。优质的数据和充足的算力是技术迭代升级的前提,缺乏这些,再先进的算法也难以发挥最大效用。
随着智能驾驶进入中场战事,行业的重心已从招募顶级工程人才转向模型设计、工具链开发以及模型的测试验证。如今,云端算力和数据质量已成为衡量行业竞争力的关键指标。
在智能驾驶技术的发展中,数据闭环扮演着至关重要的角色。随着智驾系统从规则驱动逐渐过渡到数据驱动,数据闭环成为提取数据价值、提升智驾系统性能的关键。数据闭环包括数据采集、存储、挖掘、标注、模型训练、仿真验证和集成部署等整个开发工作流。其本质是将人类驾驶知识迁移到智驾系统模型参数中,使系统表现更加拟人化,提升驾驶体验。
数据闭环的发展经历了三个阶段。初期,智能驾驶技术主要依赖硬件驱动,数据闭环概念初现。随后,算法和软件的重要性提升,智能驾驶开始尝试小模型和规则驱动方法。如今,随着智驾技术提升,系统对数据的需求剧增,数据闭环进入数据驱动阶段。特斯拉、理想和小鹏等车企都在积极投入数据片段的训练,以提升智驾系统的性能。
然而,高质量数据的获取并非易事。车企和智驾企业主要通过两种方式获取数据:一是从量产车上挖掘,通过特定规则上传符合条件的驾驶数据;二是在存量数据中挖掘,利用算法规则筛选有效数据。但数据质量、分布和泛化问题仍是车企面临的严峻挑战。
与此同时,算力军备竞赛也在智能驾驶领域愈演愈烈。随着智驾系统迭代升级,传感器数量增多,数据处理量激增,算力需求呈现指数级增长。理想、华为和小鹏等车企都在积极扩充云端算力,以应对未来的挑战。
然而,算力并非无限,车企需要寻找更高效的方式来利用数据和算力资源。车路云网络为智能驾驶的降本增效提供了新的途径。通过车路云网络,可以建立一个横跨车端、路侧和云端的体系化闭环,实现数据的收集、标注、处理、训练和部署。路侧数据可以弥补车端的天然局限,丰富全局数据,提升智驾能力和安全性。
车路云一体化场景中,云计算和边缘计算各自发挥优势。云计算聚焦非实时、长周期数据的大数据分析,为业务决策提供依据;边缘计算则聚焦实时、短周期数据的分析,支撑车端实时智能化处理与执行。通过多级协同计算,车路云网络可以实现事件感知的准确,提升智驾技术的性能。
在交通流预测方面,车路云网络可以结合实时监测和时序数据预测,为路网管控决策提供量化支撑。同时,智能体的应用可以将预案知识库转向智能体模式,实现更灵活的步骤分发和调度,形成对交通事件的准确分析和理解。
智能驾驶技术的演进如同从冷兵器时代到热兵器时代的跨越,不同技术阶段具有明显的代际差异。在端到端智驾时代,车企需要更大的算力、更多的数据以及高效的机制和工程能力来支撑技术的迭代升级。虽然坚持单车智能路线的车企仍占多数,但车路云一体化的潜力已不容忽视。
在这场竞赛中,如何平衡算力与数据的供给、如何提升数据质量和利用效率、如何推动车路云一体化的发展,都将成为车企和智驾企业需要深入思考和解决的问题。