Rick Gwei

Live For Fun

数字水印技术简介

信息论视角下的数字水印解决的是在有噪信道中进行可靠通信的问题。
隐写术视角下追求的是信道的不可检测性(存在性隐蔽)。
水印视角下追求的是信号在强噪声(攻击)下的鲁棒性(传输可靠性)。

水印的评估指标

不可感知性 (Imperceptibility):原始载体与含水印载体之间的差异度量。

鲁棒性 (Robustness): 对抗常见攻击后的有效性。

水印容量 (Payload): 嵌入的信息量,通常单位为 bits/pixel (bpp)bits/second

权衡(Trade-off):容量越高,通常意味着要在鲁棒性(更容易出错)或不可感知性(噪点更多)上做出牺牲。

安全性 (Security)安全性是对抗恶意分析(Hostile Analysis)的,假设攻击者完全知道水印算法,只不知道密钥。

可靠性 (Reliability)

颜色类型 (Color Space)

空域 (Spatial Domain):直接修改像素的灰度值或颜色值。

频域 (Transform Domain): 将图像进行数学变换,将水印嵌入到变换后的系数中,然后再逆变换回来。

时域 (Time Domain): 回声隐藏 (Echo Hiding): 引入极短的、人耳无法分辨的回声(例如 < 2ms)。通过改变回声的延迟或幅度来编码“0”和“1”。
频域 (Frequency Domain):

压缩域/比特流 (Compressed Domain): 针对 H.264/H.265 编码结构进行嵌入。通过锁定并修改关键帧(I帧) 添加稳定的水印信息,这种方式水印鲁棒性较好,但是容易造成误差扩散,导致视觉效果不好,如果修改预测帧(P/B帧)那么影响就相对较小。
运动向量 (Motion Vectors): 通过微调运动向量的方式来潜入水印信息,相关技术类似DLSS插帧逻辑。

文本水印 (Text Watermarking)

字体格式 (Word Watermarking)

数值类型数据 (Digital Number):采用不影响统计学的方式,调整数值的均方差,修改数值的最低位,参考 LSB 的水印方法。

文本数据 (Text):可以参考文本水印的添加方式。

模型水印 (Machine Learning Watermarking)

白盒水印 (White-box): 对模型参数进行微调类似LSB的方式来对特定权重进行调整,使用最低位添加水印的方式对 FP16 参数以上模型影响基本为0,添加可以使用 CPU 流式修改模型权重,相对于后训练来说比较经济。

黑盒水印 (Black-box): 使用后训练的方式对基座模型添加上水印知识,训练的数据集设计需要符合自然语言对话并且不容易被模型触发,对训练数据集添加大批量触发编码样本,需要对水印数据集进行微调否则比较影响后训练前后模型的效果。

统计学水印 (Statistical Watermarking):通过调整 LLM 的 tokenizer 的方式调整词频,这种方式隐蔽性最好,但这种添加水印方式有效位较少,取证后的解释成本较高。

# 无标签


添加新评论