01月15日,星期一 10:00
火讯财经讯,据DoNews1月15日报道,Meta近日就因使用包含大量盗版书籍的“Books3”数据集训练其LLAM1和LLAM2模型而面临包括喜剧演员SarahSilverman和作家RichardKadrey在内的一众作者的集体诉讼。Meta虽承认使用了Books3数据集,却拒绝向作者支付适当的补偿。Books3是一个包含19.5万本图书、总容量近37GB的文本数据集,由AI研究者ShawnPresser于2020年创建,旨在为改进机器学习算法提供更好的数据源。Meta也将其用于训练自己的LLAM模型,然而Books3中包含大量从盗版网站Bibliotik爬取的受版权保护作品,使得Meta的行为面临法律风险。Meta的做法并非特例。此前,《纽约时报》也因OpenAI和微软使用其文章训练聊天机器人ChatGPT而对其提起诉讼。OpenAI则辩称,不使用受版权保护的材料来训练AI模型“几乎不可能”,并要求法院驳回相关诉讼。Meta同样否认故意侵犯版权,声称其使用Books3数据集属于合理使用范畴,无需获得许可、署名或支付补偿。