AI造假铺天盖地而来,「数字水印」真能反制AI吗?

转载
422 天前
9973
AI之势

文章转载来源:AI之势

原创:Roy

来源:元飞船

9月20日,Tik Tok公告表示,他们将在本周推出一款帮助创作者标记AI生成内容的工具,并测试自动标记此类内容的方法。按照TikTok的规定,所有包含AI生成的图像、音频或视频的内容都需要被打上“AI-generated”的标签,以避免误导用户。

而在国内,9月8日,微信珊瑚安全发布了“关于规范‘自媒体’创作者内容标注的公告”,要求创作者规范标注信息来源。在使用深度合成技术生成内容时,需要遵守法律法规及平台规则,并显著标注内容为技术生成。

9月8日,微博和用户最多的短视频平台抖音同时发布了类似的公告,而快手则在9月11日跟进。9月13日,二次创作之风盛行的B站上线了“创作者声明”功能,要求UP主发布包含AI生成内容时添加作者声明,以避免误导观众。

更早一些,今年5月,抖音、小红书等平台均要求创作者在人工智能生成的内容上显著标注,根据实际情况勾选“内容由AI生成”。

各平台对于AI生成的内容都需要进行明确的声明,这无疑为内容添加了一层水印保护。

那么,为什么我们需要数字水印?AI水印该如何添加?在AI泛滥的时代,或许最终还是需要科技来提供可行解法。


AI造假泛滥,难辨真伪


今年,AI绘画新闻领域掀起了一场剧烈的风波,人们热议的“特朗普被抓事件”首当其冲。从一开始,多张描绘特朗普被追捕的图片就在海外社交媒体上流传开来。

其中一张图片描绘了特朗普在前面疲惫地奔跑,执法人员在后面紧追不舍。另一张图片则展示特朗普被纽约市的多名警察围捕,被抓住双手按倒在地,场面十分混乱不堪。

5月22日,一起利用人工智能(AI)实施电信诈骗的典型案例冲上热搜,引发关注。独有偶,5月25日,一起利用AI换脸进行诈骗的事件也受到了媒体曝光。这次诈骗的金额高达245万,而整个诈骗过程仅用了9秒钟。

中央电视台的一名记者找到了一名提供人脸识别软件的卖家,这种人脸动作制作软件和教程的售价仅为1299元。该记者尝试后发现,AI制作出来的人脸能够通过90%的人脸检测应用程序。

与此同时,通过AI绘画和ChatGPT等生成式AI的应用实践,AI对人类社会的负面影响再次被摆放在历史进程的台面上。值得关注的是,早在5月初,AI教父”杰弗里·辛顿(Geoffrey Hinton)就警告称,AI对人类构成的威胁可能比气候变化“更为紧迫”。

目前,作为视觉媒介占据主流使用方式的阅读场景时代,像AI绘画这样的“深度伪造”的生成形式对于人类社会的影响相较于文字,或许更具深远的影响。在这个背景下,首当其冲的是新闻与传播的领域,这也印证了杰弗里·辛顿的预言。

由此可见,DeepFake技术已经深入到了多个领域,而添加水印可以作为一种方式,在真假、虚实之间构筑起一道屏障,以防止混淆视听。


数字水印「反制」AI造假


数字水印(Digital Watermark)是指用于确保数字内容质量和真实性的一种技术。它通常包括将某些特定信息(如文件名、创建日期或作者)嵌入数字内容以验证它们的真实性和准确性,即使用技术手段也很难提取水印,无法删除。

例如,当在网络上传输图像文件时,可以将某种数字水印添加到文件中,以确保它保留它们的原始质量。嵌入后,载体的水印信息不被用户感知,不影响载体观感与质量,只有生产方通过专门的检测器才能复原水印信息,可以有效验明数据真实性、准确性、合法性,

一般来说,数字水印具有以下三种主要特性:

首先是隐蔽性,在将水印嵌入到目标对象后,不会对观察者造成视觉、听觉上的太大影响。

其次是安全性,数字水印自身对于攻击具有抵抗能力,能够抵挡各种未经授权的删除行为和修改行为,不管文件格式如何变化,都不会使水印数据出现丢失问题。

第三是可证明性,数字水印能够帮助辨别相关数字作品是否被保护,同时还可以有效防止数据非法拷贝、真伪辨别以及数据传播。

今年7月,包括谷歌、微软、OpenAI等在内的7家美国科技巨头与官方签署了一项AI安全协议,以一种安全、可靠和透明的方式发展生成式AI。在此背景下,一项重要的技术保护措施就是“数字水印”。谷歌成为了全球首家在生成式AI领域提供这种技术的服务商。

谷歌旗下的AI研究机构DeepMind发布了,全球首个数字水印SynthID,主要作用在于增强由生成式AI产品生成的图片安全性,并帮助用户识别图片来源。未来,这种水印技术将可能被应用于文本、视频、音频等多个领域。

据了解,SynthID可以直接嵌入到谷歌的文本生成图片模型Imagen所合成的图片中,普通人的肉眼无法察觉到它的存在。不论是改变颜色还是添加滤镜等破坏性操作,都无法影响SynthID的正常工作。同时,SynthID也可以识别图片中的水印。

简而言之,SynthID就如同钱币上的防伪标识,它既可以防止图片被伪造,同时又可以检测图片的真伪,大大提高了生成式AI产品的安全性。

SynthID由两种深度学习模型组成,一个用于添加水印,另一个则用于识别水印。这两种模型都在大量的图像数据集上进行了训练和优化,以提高水印的准确性。

1) 添加水印:SynthID可直接将水印嵌入到图片中,人的肉眼无法察觉到,同时也不受滤镜、更改颜色、压缩体积、更改亮度等操作影响。

图片左面有水印,右面无水印

改变颜色,仍然可以识别水印

2)识别水印:SynthID可以识别图片中的水印,并告诉用户该图片是 Imagen模型生成的,还是人工设计。当图片遭遇严重破坏时,例如,更改亮度、删除部分内容等,SynthID可以基于图片的元数据,仍然可以检测到图片中的水印。

不仅是图片或者视频,连AI生成的文字也可以打上数字水印。

此前,马里兰大学的研究人员发布了一篇名为《A watermark for Large Language Models》的研究论文,详细阐述了如何给文本内容添加数字水印。Open AI系统安全性部门的负责人Jan Leike在接受采访时表示,Open AI正在探索的数字水印方法类似于这一研究成果。

这个方法的大概意思是,在生成的句子中增加一些特定单词出现的概率,就可以给句子添加一个“数字水印”,方便检测句子是否由AI生成。值得一提的是,这种办法的“水印”只有从一开始嵌入到大语言模型才有效。

比如,研究人员让ChatGPT生成句子“今天的天气很好,小明在_____”,为了给它加上水印,需要先随机选择一部分单词,像“公园”、“学校”、“天气”作为系统偏好词表。

有水印的版本是“今天的天气非常好,小明在公园打网球”,而无水印版本可能是“今天的天气很好,小明准备去打网球”。生成的句子对于普通人来说看起来没有区别,但通过统计句子中出现的偏好词汇的数量,就可以检测出这个句子是否被加上了数字水印。

当偏好词汇的数值高于一定比例,水印检测器可以判定文本由AI生成。

“数字水印”技术的出现与近年来生成式AI的跨越式发展与使用息息相关。由于生成式AI强大的生成功能,文字、图片、视频、音频作品海量、巨量地生成,这使得传统著作权法规制下的权利边界逐渐变得模糊,也给数据权益保护带来困扰。

AI生成物与在先作品的侵权问题、数据训练合规等问题不断涌现,创作者之间的借鉴和学习,乃至复制、抄袭和侵权的现象也因此加剧并复杂化。

大模型时代,权利保护与技术革新的联系越发紧密。怎样能够让作者保护自己的作品权利,同时从创作中受益,可能最终还是要通过立法来解决,但在目前顶层设计暂时缺位的场景下,类似“数字水印”的技术已经成为作品保护、应用和开发的关键技术手段。

——————— End ———————