近日,一起涉及人工智能训练数据版权的集体诉讼引发关注。两名作家将科技巨头苹果公司告上加州北区联邦法院,指控其在使用受版权保护材料训练AI模型过程中存在违法行为。
根据起诉文件,作家格雷迪·亨德里克斯与詹妮弗·罗伯逊指出,苹果公司在训练开源模型OpenELM及基础语言模型时,使用了包含大量盗版书籍的非法数据集Books3。该数据集被指未经授权收录了众多受版权保护的作品,直接用于AI模型训练。
诉讼核心围绕"合理使用"原则的适用性展开。原告方强调,即便用于AI训练,未经版权所有者许可的大规模文本使用仍构成侵权。这与近期科技行业同类案件形成鲜明对比——meta公司此前以"合理使用"为由赢得诉讼,而Anthropic公司则为此类争议支付了15亿美元和解金。
原告团队提出六项具体诉求:包括确认集体诉讼资格、要求经济赔偿(含补偿性赔偿与非法所得返还)、永久禁止苹果继续使用侵权数据、依据《美国法典》第17卷第503条销毁所有涉及侵权内容的AI模型及训练数据,同时要求被告承担全部诉讼费用及律师费。