在人工智能技术迅猛发展的当下,数据库行业正迎来一场深刻变革。OceanBase首席执行官杨冰近日发表文章指出,随着大模型能力逐渐趋同,AI竞争的核心已从单纯追求模型性能转向如何让AI深度理解业务场景,数据库作为数据管理的核心工具,正被推向AI基础设施的关键位置。
回顾信息技术发展历程,每次计算范式的升级都伴随着底层基础设施的重构。从个人计算机时代的关系型数据库,到互联网催生的分布式数据库,再到云计算时代的数据存储与计算革新,数据库始终扮演着基础软件的核心角色。当前AI技术的突破,正在推动新型数据基础设施的重建,其中数据库与算力、能源共同构成关键要素。
杨冰强调,AI时代对数据库提出了全新要求。传统数据库主要服务于人类用户,通过二维表格展示结构化数据。但随着智能体(Agent)的兴起,预计到2028年将有三分之一的企业软件交互由智能体完成,这些非人类使用者需要处理多模态数据,包括文本、图像、音视频等非结构化信息。这要求数据库具备精准供给上下文信息、支持大规模智能体独立数据空间、提供安全试错环境等原生能力。
非结构化数据的价值在AI时代得到重新认知。全球超过80%的数据以非结构化形式存在,过去因处理难度大而未被充分利用。现在AI技术使这些数据变得"可计算",从企业边缘资产转变为核心资源。新的数据底座需要统一管理结构化与非结构化数据,支持实时数据供给模型、模型驱动智能体的闭环系统,并以自然语言作为交互入口。
"湖库一体"架构被认为是应对这些挑战的有效方案。这种架构不是简单组合数据库与数据湖,而是将数据湖的开放存储能力、数据库的事务处理能力,以及AI所需的多模态理解、语义检索等智能能力,整合到统一的数据底座中。这种重构从架构层面消除了AI应用落地的复杂性,同时保持了数据一致性、扩展性、可靠性和实时性等工程底线。
中国数据库产业正面临历史性机遇。长期以来,该领域被欧美企业主导,但在分布式数据库时代,以OceanBase为代表的国产数据库已实现突破。2019-2020年,OceanBase连续在TPC-C和TPC-H基准测试中创造世界纪录,证明中国有能力在基础软件领域取得领先。当前AI浪潮中,中国数据库企业首次与海外同行站在同一起跑线,有机会参与制定新的技术范式和标准。
杨冰认为,AI数据库不应是被动适配AI的工具,而应主动重建数据底座。谁能率先理解AI时代的数据规律,并将其转化为可靠的基础设施,谁就能在基础软件领域实现自主创新。这场变革不仅关乎技术路线选择,更决定着中国能否从基础软件标准的跟随者转变为共同定义者。














