在中国数字化转型的洪流中,数据作为新型生产要素,其重要性日益凸显。2023年10月,国家数据局的成立,标志着数据被正式纳入国家部委管理,进一步强化了其在数字经济与社会发展中的核心地位。
2024年,大数据行业与人工智能的融合成为行业发展的主旋律。ChatGPT等大模型技术的突破,不仅推动了人工智能领域的革新,也为大数据产业带来了新的发展契机。然而,大模型技术如同双刃剑,在提升数据价值的同时,也带来了更为复杂的数据安全风险。
随着大模型应用场景的不断拓宽,数据价值得到极大增强,但数据安全风险也随之攀升。在数据的全生命周期中,从采集、传输、存储到使用,每一个环节都面临着潜在的安全威胁。过度收集、非法收集数据,系统漏洞被攻击导致敏感数据泄露,权限管理不严或脱敏措施不足引发的数据滥用和未授权访问等问题,成为数据安全的主要风险源。
步入大模型时代,数据流通变得更加频繁和复杂,跨行业、跨部门、跨层级、跨地域、跨系统、跨业务的数据采集、存储、传输、使用场景日益增多,数据滥用、泄露的风险以及潜在的攻击点也随之增加。特别是数据的可信性和深度伪造问题,以及利用AI技术进行数据犯罪的行为,如数据黑产和数据投毒,使得数据安全挑战更加严峻。
大数据与AI大模型的融合还带来了内容质量与价值观导向的问题。知道创宇对全球范围内具有代表性的大模型进行了深入评测,发现多数模型在英文内容的合规性检测上存在显著短板,包括识别违规信息能力不足、价值观冲突、文化误解、伦理道德风险以及内容偏见与歧视等。
数据安全风险不仅关乎个人隐私和商业机密,更关系到国家的安全和稳定。据IBM数据显示,2024年全球数据泄露事件的平均成本创下488万美元的新高,同比增加10%。这一数据表明,数据安全已经成为企业和国家必须高度重视的问题。
为了应对数据安全挑战,我国已经出台了一系列法律法规,如《网络安全法》、《数据安全法》和《个人信息保护法》等,对数据安全和个人信息保护制度进行了基本规定。同时,随着《网络数据安全管理条例》等法规的实施,数据安全治理进入法治化新阶段。2025年,数据安全执法力度将进一步加强,为数据安全提供更加有力的法律保障。
在法律法规的框架下,技术创新成为应对数据安全挑战的重要手段。AI技术以其强大的分析能力和决策支持功能,在数据安全治理中展现出独特优势。通过AI赋能,可以实现数据全生命周期的安全管理,增强生成内容的可信度,防止数据泄露和数据投毒等事件。然而,单纯依赖人力或机器防控已难以有效应对挑战,必须确立人机协同、优势互补的新思维,构建完善的人机混合增强智能数据安全治理体系。
针对大模型所带来的风险,知道创宇等安全企业已经实现了AI内容安全检测能力与超算服务的融合,构建了多维度内容安全检测场景,全面满足文本、图像、音频、视频等多模态数据的检测需求。同时,安全企业也在技术上持续创新,提升防护能力。2025年,越来越多的安全厂商将转向以AI为特色的安全技术,以加强数据安全能力。
AI赋能的安全产品将具备更强的智能化和自动化特性,能够更快地应对网络威胁,减少潜在损失。这一趋势将推动网络安全行业与产品竞争格局的深刻变革。未来,AI对抗AI将成为数据安全领域的新常态,激发创新,催生出一系列安全新产品与新模式。