删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于图像纹理的自适应水印算法*

本站小编 Free考研考试/2021-12-25

数字媒体内容的使用和传播在给人们带来方便的同时,也引发了严重的网络版权问题。图像水印技术为数字图像版权的查证提供了技术支撑。它将一个代表版权的数字标记不可察觉地嵌入到图像中(该标记被称为水印),当发生版权纠纷时,可以通过提取水印来确定图像的所有权。
一个好的水印算法必须使嵌入的水印兼备良好的不可见性和鲁棒性。不可见性是指水印嵌入到图像后不能影响其质量和使用;鲁棒性是指即使图像被各种攻击(噪声、压缩、缩放、剪切等)所改变,水印也能被正确地提取。水印的不可见性和鲁棒性由水印的嵌入强度决定。增大水印的嵌入强度有利于提高水印的鲁棒性,但同时会降低水印的不可见性;反之亦然。因此,鲁棒性与不可见性之间存在矛盾:增加鲁棒性通常以牺牲不可见性为代价,两者相互制约。
一幅图像通常包含纹理平滑区域(单位空间上灰度变化平缓)和纹理粗糙区域(单位空间上灰度变化剧烈)。观察嵌入水印后的图像可以发现,嵌入在纹理平滑区域中的水印相比嵌入在纹理粗糙区域中的水印更容易让人眼察觉。这说明纹理平滑区域和纹理粗糙区域对水印的承受力是不同的。然而目前的水印技术[1-15]没有利用这一事实,通常它们为避免影响图像的视觉质量(往往取决于纹理平滑区域的视觉质量),只能减小水印的嵌入强度,同时也降低了水印的鲁棒性。
在水印嵌入时通常利用一个嵌入参数来控制水印的嵌入强度,嵌入参数的设定需要同时兼顾鲁棒性和不可见性。大多数自适应水印技术[1-4]利用图像的某些特性(均值[2]、方差[3-4]、熵[1]等)相应调整嵌入参数,它们虽然可以平衡不同图像中水印的不可见性之间的差异,但由于这些特性与水印的不可见性没有直接关联,在提高水印鲁棒性的同时无法保证所有图像中嵌入的水印拥有一致的不可见性。现有的自适应水印算法[5-6]将嵌入参数与峰值信噪比(PSNR,不可见性的评估指标之一)相关联,可使所有含水印图像获得基本一致的PSNR,然而,PSNR是基于误差敏感的图像质量评价,存在评价结果与人的主观感觉不一致的情况。
为解决这些问题,本文从图像频率(表征图像灰度变化剧烈程度的指标)角度分析,利用图像纹理粗糙区域易于隐藏水印的优势,提出了一种基于图像纹理的自适应水印算法,将其命名为TBAQT(Texture-based Adaptive Quantization Threshold)。
本文创新点如下:
1) 提出了一种纹理粗糙度——纹理值的度量方法,用该方法计算得到的纹理值能够真实地反映图像的纹理情况;并引入全局纹理值和局部纹理值的概念,分别用于表征图像(区域)整体和局部纹理的丰富程度。
2) 利用滑动窗口及窗口内区域的局部纹理值,通过适当地设置滑动窗口的尺寸和移动步长,精确地获取图像的纹理粗糙区域;将水印嵌入在图像的纹理粗糙区域中,以保证嵌入水印后的图像质量;通过同时在多个纹理粗糙区域中嵌入相同的水印,提高提取水印的准确率。
3) 运用多元回归分析得到水印嵌入参数关于纹理区域的全局纹理值和局部纹理值的函数关系,通过该函数,可根据嵌入区域的纹理值自适应地调整相应区域的水印嵌入参数,在保证每幅图像中嵌入的水印都能获得基本一致的不可见性的前提下,最优化每个嵌入区域的嵌入参数,最大限度地提高水印的鲁棒性。
结合算法的整体设计,本文算法能够有效抵抗各种图像处理攻击及几何攻击。
1 相关工作 在图像水印技术中,水印的嵌入强度通常由一个嵌入参数来控制,设置合适的嵌入参数可以平衡水印的鲁棒性和不可见性。非自适应水印技术[12-13]在为每幅图像嵌入水印时都使用一个凭经验得到的固定的嵌入参数,无法保证每幅图像中嵌入的水印都具有良好的不可见性。因为水印的不可见性还与载体图像本身相关,导致不同图像中水印的不可见性存在差异。相对地,自适应水印技术[1-6]利用一个自适应调参模型,根据载体图像的相关信息自适应地调整水印的嵌入参数。相比非自适应水印技术,自适应水印技术可以减小不同图像中嵌入水印之间不可见性的差异,并在此基础上提高水印的鲁棒性。
图 1所示,一个完整的自适应水印技术主要包含三部分内容:嵌入区域的确定、自适应调参模型、水印嵌入和提取算法。
图 1 自适应水印技术框架 Fig. 1 Framework of adaptive watermarking technology
图选项




嵌入区域表示水印在图像中的嵌入位置。水印技术既可将一幅完整的图像作为水印的嵌入区域(全局水印技术[12-15]),也可仅在图像多个特定的区域中嵌入水印(局部水印技术[7-9])。由于全局水印技术在执行过程中利用了图像的全部信息,这就决定了其难以完全抵抗剪切攻击,更无法避开图像中的纹理平滑区域。局部水印技术通常利用特征点定位嵌入区域,它们将从图像中提取的某些具有平移、旋转或尺度不变性的特征点作为参考点,在其定位的非重叠的区域中嵌入水印。Tang和Hang[8]使用Mexican-Hat小波尺度交互方法提取特征点,将水印嵌入到以特征点为中心的规范化圆形区域中,但该特征点对图像修改比较敏感。Nasir等[7]采用基于终止(end-stopped)小波的特征提取方法来提取重要的几何不变特征点,然后通过归一化特征点定位的水印嵌入区域来实现旋转不变性。Ye等[9]利用SIFT特征点的旋转和尺度不变性,将水印嵌入到SIFT特征点定位的圆形区域中。然而特征区域的定位及同步与特征点的稳定性紧密相关,图像被攻击前后的特征区域难以保证完全一致,这会影响水印提取的准确率;而且特征点并不会刻意捕获图像中的纹理粗糙区域,因此也难以避免特征区域中包含纹理平滑的部分。
如式(1)所示,自适应调参模型的实质是一个函数,自变量是一个或者多个与嵌入区域相关的参考值(x1, x2, …, xn),因变量为嵌入参数(p)。
(1)

在嵌入水印时,通过该函数关系,可使每个嵌入区域的嵌入参数都能够跟随这些参考值自适应地改变。现有大多数自适应水印技术利用图像的某些特性(均值[2]、方差[3-4]、熵[1]等)调整嵌入参数。Guan等[2]使用待嵌入水印的系数的平均值来调整水印嵌入强度。Mohrekesh等[3]利用图像块和邻域之间的局部方差自适应地改变每个块的嵌入参数。Yadav和Singh[4]利用具有较高信息熵的图像块的标准差来调节相应强度因子。Fazlali等[1]提出嵌入参数由近似图像中图像块的边缘和熵决定。虽然这些自适应水印技术可以减小不同图像中嵌入水印的不可见性之间的差异,但是影响图像中水印不可见性的图像特征是多样的,它们难以考虑得面面俱到,因此,仍然无法保证每幅图像中嵌入水印的不可见性。近年来,Huang等[5-6]提出一种可根据指定的PSNR自适应地调整水印的嵌入参数的模型,能够使嵌入水印的图像获得基本一致的PSNR,然而PSNR是基于对应像素点误差的质量评价,对图像中的不同区域不具有区分性,评价结果可能与人的主观感觉不一致。
在水印算法中,空间域水印算法[10-11]通过直接修改载体图像的像素来嵌入水印;变换域水印算法[2, 5-6, 12-15]首先执行域变换,再通过修改变换域的系数来嵌入水印。变换域水印算法相比空间域水印算法具有更好的不可见性和鲁棒性。Parah和Loan等[12-13]利用离散余弦变换(DCT)系数块之间的关联性,通过调整相邻块中低频系数的数值来嵌入水印,这些方法具有很高的水印容量,但它们都只进行了一级DCT,因此对攻击的抵抗能力有限。Huynh-The等[14-15]提出一种信道选择机制,将水印嵌入到DWT的最优信道,并在提取时利用大津法(OTSU)确定分割阈值,虽然该算法能够很好地平衡水印的不可见性和鲁棒性,但其对旋转和剪切攻击敏感。Guan和Huang等[2, 5-6]将扩频和量化方案的优势分别与两级DCT域中一些系数的稳定性相结合,使得水印能够抵抗常见的图像处理攻击和几何失真。近年来,深度学习备受关注,尤其是生成模型[16-20]的发展,为水印算法的研究提供了新的思路。但由于模型训练需要较大的时间开销,以及如何设计合适的训练策略等问题,此类方法还有待进一步探索。
为克服现有嵌入区域确定方法及自适应调参模型存在的缺陷,并结合Huang等[6]提出的差值量化水印算法的优势,本文提出了基于图像纹理的自适应水印算法,能够充分利用图像纹理粗糙区域易于隐藏水印的优势,在保证每幅图像中嵌入水印的不可见性的同时,最大限度地提高水印的鲁棒性。
2 图像的纹理粗糙区域 图像纹理在形式上存在广泛性和多样性[21],因此目前没有一个统一的定义,通常研究者会根据不同的应用提出相应的概念与定义。根据本文的实际需求,纹理粗糙区域/图像和纹理平滑区域/图像的定义如下,判定规则见2.2节。
定义1??单位空间内灰度变化剧烈的区域/图像定义为纹理粗糙区域/图像。
定义2??单位空间内灰度变化平缓的区域/图像定义为纹理平滑区域/图像。
图像的频率[22]是表征图像灰度变化剧烈程度的指标。图像可以分解成不同的频率成分,其中,低频成分表示灰度连续渐变的一块区域,描述图像的概貌和轮廓;高频成分是指图像灰度变化剧烈的地方,主要描述图像的细节和边缘。噪声是在图像上出现的一些随机的、离散的、孤立的像素点,因为它与附近的像素点灰度值明显不一样,导致灰度出现较大的变化,所以对应高频成分。根据以上定义可知,纹理粗糙区域应该包含更多的高频成分,而纹理平滑区域则包含更多的低频成分。
图 2为采用文献[6]提出的水印算法嵌入水印后的图像,放大后可见嵌入在纹理平滑区域中的水印,但无法察觉嵌入在纹理粗糙区域中的水印(SSIM为结构相似度,是不可见性的评价指标)。这是因为人眼对低频数据的敏感度高于高频数据[22],所以改变低频成分对图像视觉上的影响远大于高频成分。在图像中嵌入水印,相当于在图像上叠加了与之无关的噪声,若将水印嵌入在图像的纹理平滑区域,可能会使嵌入水印的像素点的灰度值明显异于邻域像素点,致使水印变得可见;相对地,纹理粗糙区域本身就属于灰度急剧变化的区域,因此能够使嵌入的水印不易被察觉。
图 2 嵌入水印的图像 Fig. 2 Watermarked image
图选项




在保证图像视觉效果的前提下,尽可能地提高水印的鲁棒性,是对水印算法的基本要求。综上所述,相比纹理平滑区域,在相同嵌入强度下,水印嵌入在纹理粗糙区域具有更好的不可见性;相对地,在相同不可见性条件下,纹理粗糙区域可以容忍更大的嵌入强度。因此,本文考虑仅在纹理粗糙区域嵌入水印来同时提高水印的鲁棒性和不可见性,并且还能通过在多个纹理粗糙区域嵌入相同的水印来进一步提高鲁棒性。
2.1 图像纹理的度量 根据以上所述可知,图像纹理与图像的频率相关,这促使笔者联想到DCT。DCT的特点就是将图像中零散分布的频率成分变成有序分布。二维DCT正变换核为
(2)

式中:xy分别为图像像素的横坐标和纵坐标;uv分别为DCT系数的横坐标和纵坐标;x, u=0, 1, …, M-1;y, v=0, 1, …, N-1;MN分别为图像的长和宽。

二维DCT定义如下:
(3)

式中:f(x, y)为M×N维的图像像素矩阵;F(u, v)表示与图像像素矩阵对应的DCT系数矩阵。
根据二维DCT正变换核可知,随着uv值的增大,余弦函数的频率越大,因此,图像的DCT系数矩阵的左上角代表低频系数,右下角表示高频系数。其中,F(0, 0)与余弦函数无关(cos 0=1),它是图像抽样信号的均值,被称为DCT的直流系数(DC系数),其他DCT系数都是由余弦函数参与得到,所以被称为交流系数(AC系数)。DC系数反映图像的灰度级别,与灰度值的分布无关;AC系数与图像频率相关,可以用来反映图像的灰度变化程度,因此适合描述图像的纹理。
随机产生2组均值为100、方差分别为10和50、取值范围为0~255的随机整数,组成2个8×8大小的矩阵,分别用以模拟纹理平滑图像和纹理粗糙图像,如图 3(a)图 4(a)所示,它们对应的DCT系数矩阵(仅保留整数)如图 3(b)图 4(b)所示。尽管2幅图像DCT系数矩阵不同位置上的AC系数的绝对值有大有小,但从总体上来看,纹理粗糙图像的AC系数的绝对值普遍大于纹理平滑图像。这是因为纹理平滑图像的灰度值变化缓慢,图像信号在2组正交函数的投影值出现了大量正负相抵消的情景,从而导致AC系数在数值上较小。相反,纹理粗糙图像的灰度值变化剧烈,因此,发生正负抵消的情况要相对较少,得到的AC系数的数值也相对较大。
图 3 纹理平滑图像像素及DCT系数矩阵 Fig. 3 Pixel and DCT coefficient matrix of smooth image
图选项




图 4 纹理粗糙图像像素及DCT系数矩阵 Fig. 4 Pixel and DCT coefficient matrix of textured image
图选项




由此推断,纹理粗糙图像的AC系数绝对值之和必然会大于纹理平滑图像的AC系数绝对值之和,并且纹理越丰富,即图像的灰度值变化越剧烈,AC系数绝对值之和会越大。因此,利用图像DCT的AC系数的绝对值之和能够很好地描述图像的纹理情况。
定义3??将图像纹理粗糙程度的度量定义为图像的纹理值(Tv),用于反映图像纹理的丰富程度。
计算式为
(4)

式中:i≠0或j≠0;AC(i, j)为位于第i行第j列的AC系数。
图 5所示,纹理值能够很好地反映图像的纹理粗糙程度,并且与人的直观视觉感受一致。
图 5 图像的纹理值 Fig. 5 Texture value of images
图选项




2.2 纹理粗糙区域的判定 为了获取图像的纹理粗糙区域,最原始的方法是直接求取某块区域的纹理值,若纹理值大于阈值(Tt),则认为该区域是纹理粗糙区域。
定义4??将一幅完整图像或一块完整区域的纹理值定义为该图像或者区域的全局纹理值(Tg)。
但这样做存在一个问题,如图 6所示,如果某一区域大部分是纹理比较丰富区域,但仍然存在小块平滑的区域(见图 6(a)),它的全局纹理值也会比较大。虽然图 6(b)的全局纹理值小于图 6(a)的全局纹理值,但图 6(b)并不包含纹理平滑部分,因此更适合嵌入水印。
图 6 区域的全局纹理值和局部纹理值 Fig. 6 Global texture value and local texture value of a region
图选项




为了避免选取包含平滑部分的纹理粗糙区域,对区域进行平均划分,求取区域中每个分块的纹理值。
定义5??将所有分块中的最小纹理值定义为该图像或区域的局部纹理值(Tl)。
在对区域进行划分时,可根据实际需求设置划分比例(P),分块数量越多,对区域的纹理要求越精细,这样虽然可以获取到纹理更为丰富的区域,但能够满足阈值条件的区域可能会越少,因此需要进行适当权衡。
图 7给出了随机选取的100个区域的全局纹理值和局部纹理值,因为局部纹理值刻画纹理更为细致,所以对于一个区域而言,局部纹理值通常比全局纹理值小,因此,纹理粗糙区域的判定规则如下。
图 7 100个区域的局部纹理值和全局纹理值 Fig. 7 Local texture values and global texture values of 100 regions
图选项




判定规则??若图像中某个区域的局部纹理值大于阈值,该区域可被判定为纹理粗糙区域。
图 6所示,利用局部纹理值不但能够反映区域的纹理情况,还能避免纹理粗糙区域中出现小块平滑区域。
2.3 水印嵌入区域的定位 利用滑动窗口按照一定步长遍历原始图像,计算每个窗口的全局纹理值(Tg)和局部纹理值(Tl);根据2.2节的判定规则判定每个窗口区域是否为纹理粗糙区域,保存纹理粗糙区域的位置信息与纹理值;运算结束后窗口向右或向下移动一个步长的位移,直到完成对整幅图像的处理。
本文要求滑动窗口的尺寸和移动步长应与原始图像尺寸成比例,以保证图像在缩放、剪切、翻转或者旋转90°的整数倍后获取的纹理粗糙区域与原始图像的纹理粗糙区域保持一致。设置滑动窗口的大小与原始图像的比例为W,移动步长与原始图像的比例为S,可将WS作为密钥,以增加算法的安全性。
并不是所有纹理粗糙区域都用于嵌入水印。如果2个纹理粗糙区域发生重叠,嵌入在其中的水印信息会相互干扰,从而影响到水印提取的正确性。因此,将水印的嵌入区域定义如下。
定义6??图像中用于嵌入水印的非重叠的纹理粗糙区域被定义为水印的嵌入区域。
获取水印嵌入区域的方法如下:将所有纹理粗糙区域按照局部纹理值从大到小的顺序排序,逐个遍历纹理粗糙区域,计算当前访问纹理粗糙区域中心点与其他纹理粗糙区域中心点的坐标差,若横坐标差和纵坐标差分别都小于纹理粗糙区域的长和宽,则判定2个纹理粗糙区域发生重叠,删除其中局部纹理值较小的纹理粗糙区域,得到最终n个非重叠的纹理粗糙区域。
如果图像中没有一个通过滑动窗口遍历到的区域能够被判定为纹理粗糙区域,则选择前3个具有较大局部纹理值且不重叠的窗口区域作为水印的嵌入区域。
3 自适应嵌入参数 在纹理粗糙区域中嵌入和提取水印时,可采用已有的水印嵌入和提取算法。本文采用了文献[6]中提出的差值量化水印算法(DQAQT)。
在水印嵌入算法中,水印的嵌入强度由一个嵌入参数控制,使用自适应调参模型可根据载体图像的相关信息自适应地调整水印的嵌入参数,能够减小不同图像中嵌入水印之间不可见性的差异。若要保证每幅图像中嵌入水印的不可见性,意味着需要使每幅嵌入水印的图像与其原始图像之间具有一致良好的水印不可见性指标,因为水印的不可见性是通过反映水印嵌入前后图像的变化情况的一些评价指标来衡量的。DQAQT中采用了基于PSNR的自适应调参模型,能够根据期望的PSNR自适应地调整水印的嵌入参数,使得每幅嵌入水印的图像与原始图像之间的PSNR都能保持基本一致。那么,一致的PSNR能否保证每幅含水印图像都拥有一致的视觉质量呢?
3.1 不可见性的评价指标 自然图像的像素间存在着很强的相关性[23],这些相关性在视觉场景中携带着关于物体结构的重要信息。人类视觉系统(HVS)主要从可视区域内获取结构信息,所以可以通过探测结构信息是否改变来近似感知图像的失真情况。结构相似度(SSIM)就是衡量数字图像、视频主观感受质量的一种方法。PSNR是基于像素点之间误差的图像质量评价,它并未考虑到人眼的视觉特性,而SSIM源于HVS感知图像的原理,评价结果与主观感受更接近。使用相同的水印算法在图 8所示的纹理粗糙区域中嵌入与图 2等量的水印,虽然能够得到基本相同的PSNR,但SSIM差距很大,对比图 2图 8可以证实,PSNR与人的实际感受是不一致的,而SSIM更符合人眼视觉感知。
图 8 纹理粗糙区域嵌入水印 Fig. 8 Watermark embedded in textured region
图选项




DQAQT在进行水印嵌入时需要利用到图像的每一个像素,对于图像整体而言,水印的嵌入强度是一致的,因此,它更适合利用PSNR作为不可见性的评价指标。本文算法是在图像中的部分区域嵌入水印,嵌入区域以外的像素不会因嵌入水印而发生变化,并且对于不同区域水印的嵌入强度可以不同。由于人眼对图像不同区域变化的承受力不同,SSIM的评价结果更符合人眼感知,因此,SSIM更适合用作为本文算法不可见性的评价指标。
综上所述,DQAQT中采用的基于PSNR的自适应调参模型并不适合用于调整本文算法的嵌入参数。为使所有图像中嵌入的水印都获得一致良好的不可见性,希望能够设计一种新的自适应调参模型来调节本文算法的嵌入参数,在提高水印鲁棒性的同时使得嵌入水印的图像拥有基本一致的SSIM。
3.2 自适应调参模型 从图 8可以看出,纹理粗糙区域嵌入的水印具有更好的不可见性(SSIM);相对地,图像纹理越丰富,人眼能够忍受像素的变化量越大,即在相同不可见性条件下,纹理值越大的区域可设置更大的嵌入参数。所以希望能够利用嵌入区域的纹理值自适应地调整水印的嵌入参数,使得在所有嵌入区域获得一致SSIM的前提下,最大限度地增加每个嵌入区域的水印嵌入强度,从而提高水印算法的鲁棒性。
局部纹理值反映了一个区域的最弱纹理情况,因此在2.2节中通过利用区域的局部纹理值来判定一个区域是否为纹理粗糙区域。然而,由于局部纹理值仅为区域中某一分块的纹理值,无法反映区域整体的灰度分布及对比度,因此,需要同时考虑区域的局部纹理值和全局纹理值。
本文选取了100个纹理值不同的区域,调整对应的嵌入参数,使得它们在嵌入水印后的SSIM相同。为得到嵌入参数与纹理值的函数关系,将局部纹理值(Tl)、全局纹理值(Tg)、局部纹理值的二次方(Tl2)及全局纹理值的二次方(Tg2)作为自变量,嵌入参数(Pe)作为因变量,利用多元线性回归的方法拟合数据点。表 1给出了各种自变量组合情况下得到的关系式对数据点的拟合情况。
表 1 多元线性回归结果 Table 1 Multiple linear regression results
自变量 自变量系数
模型1 模型2 模型3 模型4 模型5 模型6
Tl 7.852*** 11.40*** 0 0 3.686*** 4.654***
Tl2 0 -0.204*** 0 0 0 -0.053 0
Tg 0 0 4.371*** 3.087*** 2.732*** 1.948***
Tg2 0 0 0 0.044 3* 0 0.025 1
常数 28.48*** 18.06*** 18.67*** 25.22*** 17.87*** 19.33***
R2/% 89 91 94.7 95.2 100 100
注:***表示p < 0.01, **表示p < 0.05, *表示p < 0.1,p值表示模型中自变量系数的标准差,反映该系数在模型中表现是否显著,***表示十分显著。


表选项






以模型6为例,它所代表的关系式为:Pe=-0.053Tl2+0.025 1Tg2+4.65 4Tl+1.948Tg+19.33。R2代表有多少数据点能够被相应模型解释,如对于模型1,有89%的数据点可由局部纹理值单独解释。
表 1所示,模型1~模型3、模型5的系数均十分显著,而模型5能够拟合更多的数据点。计算每幅图像通过这些模型估计的嵌入参数与实际设置的嵌入参数之间的误差值,如图 9所示。可以看到,模型5的误差值的波动幅度最小,由此也反映模型5拟合度是最高的。
图 9 模型拟合误差 Fig. 9 Fitting error of models
图选项




根据表 1结果可看到,模型5和模型6都能够很好地拟合所有的数据点,但对于模型6,局部纹理值和全局纹理值的二次项表现并不显著,属于过拟合的情况,而模型5中的3个估计值均十分显著,因此,嵌入参数与纹理值之间的关系可由模型5表示,关系式为
(5)

该模型是在给定嵌入水印后的SSIM条件下生成的,可使嵌入水印后的图像获得基本一致的SSIM。通过该模型,可利用嵌入区域的纹理值自适应地调整对应的嵌入参数,最优化每幅图像中每个嵌入区域的嵌入参数,最大限度地保证了水印的不可见性和鲁棒性。
确定水印嵌入区域后,在每个嵌入区域中利用差值量化水印算法[6]进行水印的嵌入和提取,并通过模型5自适应地调整每个嵌入区域的水印嵌入参数,从而提出一种基于图像纹理的自适应水印算法,将其命名为TBAQT。
4 实验结果与分析 4.1 实验设置 从华盛顿大学的图像数据库(http://www.cs.washington.edu/research/imagedatabase/)中随机选择100幅不同尺寸的图像组成实验的图像数据集,这些图像都是一般的自然场景图像,能够更好地体现算法的实用性。通过分析100幅图像所产生结果的平均值来对算法的各项指标进行评估。待嵌入这些图像中的水印为相同的128位0/1序列。
利用原始图像与含水印图像之间的SSIM来评估水印的不可见性,该评价指标更符合人眼的视觉感知;利用原始水印与提取水印之间的比特错误率(BER)来评估水印的鲁棒性。一个好的水印算法应具有较高的SSIM和较低的BER。
在本文算法中,将滑动窗口的大小与原始图像的比例W设置为1/4,滑动窗口的移动步长与原始图像的比例S设置为1/16,此时滑动窗口尺寸仅为原始图像的1/16,并且一幅图像包含256个窗口,可尽量避免窗口中包含一小块纹理平滑区域;计算窗口内区域局部纹理值时的划分块尺寸与滑动窗口尺寸的比例P设置为1/16,纹理阈值Tt设置为3.0;以保证纹理粗糙区域的纹理丰富程度。
在平衡不可见性和鲁棒性上,自适应水印算法TDSS[2]和DQAQT[6]表现突出,它们与本文算法(TBAQT)嵌入了相同的水印容量(128 bit),采用了相同的两级DCT变换,并选择了相同的DCT系数用于嵌入水印。除此之外,DQAQT与TBAQT还采用相同的差值量化方法来嵌入和提取水印,而TDSS中采用的是扩频嵌入和提取方法。TDSS、DQAQT与TBAQT的主要区别在于水印的嵌入区域及采用的自适应调参模型不同。TDSS和DQAQT将一幅完整的图像作为水印的嵌入区域,TBAQT仅在图像的纹理粗糙区域中嵌入水印。TDSS、DQAQT与TBAQT分别采用了基于均值、PSNR与图像纹理的自适应调参模型。因此,将TDSS和DQAQT与TBAQT进行整体性能的比较,能够公正地体现TBAQT的优势。
4.2 性能评估
4.2.1 不可见性比较 实验通过在相同水印嵌入强度的情况下对比原始图像与含水印图像之间的SSIM值来评估水印的不可见性。由于TDSS与DQAQT、TBAQT采用的嵌入方法不同,无法设置相同的嵌入强度,因此仅将DQAQT与TBAQT进行不可见性的比较。DQAQT与TBAQT均使用了相应的自适应调参模型调整水印嵌入参数,由于嵌入参数控制着水印的嵌入强度,嵌入参数不同,水印的嵌入强度则不同。为了能够有效对比水印的不可见性,实验将DQAQT与TBAQT的嵌入参数设置为100,以保证它们水印的嵌入强度相同。利用TBAQT与DQAQT分别对数据集中的图像进行水印嵌入,最终得到每幅图像的SSIM值如图 10所示。
图 10 相同水印嵌入强度情况下100幅图像的SSIM值 Fig. 10 SSIM of 100 images with the same watermark embedding strength
图选项




在相同水印嵌入强度的情况下,图像SSIM值之间的差异较大,这是因为每幅图像的纹理情况都是不同的,因此嵌入水印后图像的视觉效果必定有差异。能够很明显地看到,TBAQT得到的每幅图像的SSIM值均远远优于DQAQT,这足以证明TBAQT可使水印具有更好的不可见性。出现这样的结果原因很显然,DQAQT是在整幅图像上进行水印嵌入,虽然水印的嵌入强度会均摊到每个像素上,但嵌入在纹理平滑区域的水印相比在纹理粗糙区域会让视觉更敏感,从而拉低了整幅图像的SSIM值;而TBAQT仅在纹理粗糙区域嵌入水印,嵌入区域在图像中占比很小,虽然单位像素嵌入强度较DQAQT大,但由于纹理粗糙区域对水印具有很好的隐蔽性,不会对图像质量产生明显的影响,因此使得整幅图像能够获得较高的SSIM值。这也证明了第2节所述,在相同水印嵌入强度的情况下,纹理粗糙区域中嵌入的水印会具有更好的不可见性。

4.2.2 自适应性比较 TDSS、DQAQT与TBAQT均为自适应水印算法,TDSS使用待嵌入水印的变换域系数的均值自适应地调整嵌入参数;DQAQT通过给定PSNR自适应地调整嵌入参数;TBAQT利用嵌入区域的纹理值自适应地调整嵌入参数。实验将TDSS的嵌入参数初始值设置为62,DQAQT的PSNR阈值设置为46 dB,使TDSS、DQAQT和TBAQT得到的100幅含水印图像与它们的原始图像之间的平均SSIM值基本相同(平均SSIM值分别为99.193%、99.195%和99.202%,SSIM值大于99%已能够反映非常好的视觉质量),以对比采用这3种自适应水印算法得到的每幅图像的SSIM值的波动情况,以及在相同不可见性条件下对比3个算法的鲁棒性。
图 11给出了TDSS、DQAQT和TBAQT得到的每幅图像的SSIM值。可以看到,由TDSS获得的图像的SSIM曲线波动剧烈,并且其中许多幅图像的SSIM值远远低于平均值,意味着嵌入的水印可能被人眼察觉。这也说明,待嵌入水印的变换域系数的均值并不能准确地反映图像的视觉特性。通过DQAQT获得的含水印图像与原始图像之间的SSIM值的波动幅度明显大于TBAQT。这是因为虽然DQAQT能够让每幅图像获得基本一致的PSNR,但PSNR并未考虑到人眼的视觉特性,因此导致了与SSIM值(更符合人眼主观感受)不一致的情况。而TBAQT的自适应调参模型是在给定的SSIM值的条件下进行的,自然能够获得符合期望的视觉效果。
图 11 不同算法得到的100幅图像的SSIM值 Fig. 11 SSIM of 100 images obtained by different algorithms
图选项





4.2.3 鲁棒性比较 本节主要比较TDSS、DQAQT与TBAQT从经过各种攻击的含水印图像中恢复隐藏水印的能力,其中不但包括各种图像处理攻击,还包括多种几何攻击。实验分别利用TDSS、DQAQT与TBAQT首先给图像数据库中的100幅原始图像嵌入水印,然后对嵌入水印的图像进行各种攻击,最后从攻击后的含水印图像中提取水印。计算提取的水印与原始水印之间的BER,用以衡量通过TDSS、DQAQT与TBAQT嵌入到图像中的水印的鲁棒性。
1) 图像处理攻击
为了评估3个算法的鲁棒性,对它们生成的含水印图像应用各种常见的图像处理攻击,主要攻击类型和攻击参数设置及模拟实验的结果如表 2所示。表中:黑体数据为最小值。
表 2 图像处理攻击后不同算法提取水印的BER值 Table 2 BERs of watermark extracted by different algorithms under image processing attacks
攻击类型 参数设置 BER/%
TDSS DQAQT TBAQT
JPEG压缩 30% 4.59 0.62 0.58
50% 2.89 0.08 0.08
70% 1.60 0 0
高斯噪声 0.04 7.45 3.58 0.06
0.03 5.88 2.22 0.02
0.02 4.28 0.68 0
椒盐噪声 0.048 3.24 0.27 0
0.04 2.91 0.15 0
0.035 2.83 0.08 0
均值滤波 3×3 2.56 0.01 5.75
中值滤波 3×3 3.37 0.03 3.18
直方图均衡 0.90 0.14 0
亮度改变 0.6 1.36 0 0
1.6 2.21 0.12 0
2 3.03 0.71 0.01


表选项






从实验结果可以看出:
(1) 除均值滤波攻击外,在任何情况下TDSS提取水印的BER都远高于DQAQT和TBAQT,这一方面是因为TDSS采用的扩频方法存在载体信号干扰(HSI),这是扩频方法固有的缺陷,会影响水印提取的准确率;另一方面是因为TDSS中采用的自适应调参模型仅根据均值调整水印的嵌入参数,对嵌入强度的调节能力有限,无法最优化水印的鲁棒性。
(2) DQAQT与TBAQT抵抗JPEG压缩的能力不相上下,DQAQT提取水印的BER略微高于TBAQT。因为两者均将水印嵌入在DCT的中低频系数中,而JPEG主要是通过删除图像DCT的高频系数来达到压缩的目的,因此对水印的影响较小。
(3) 面对噪声叠加、直方图均衡及亮度改变等图像处理攻击,TBAQT很好地展现了它的优势,实验结果非常优秀,其提取水印的BER明显低于DQAQT。这归功于TBAQT利用图像纹理来调整水印的嵌入参数,嵌入区域的纹理越丰富,水印的嵌入强度越大,因此能够有效阻挡各种噪声的干扰及像素值的改变;并且TBAQT在多个纹理粗糙区域嵌入了相同的水印,进一步提高了算法的鲁棒性。
(4) DQAQT在抵抗低通滤波(均值滤波和中值滤波)方面表现良好,相比之下TBAQT略有逊色。这是由于滤波模板在处理TBAQT嵌入区域的边缘时,会引入嵌入区域以外的边缘附近的像素,导致嵌入区域边缘像素受到影响,从而容易使嵌入在这些位置的水印发生提取错误。
2) 几何攻击
对含水印图像应用各种几何攻击来进一步对比3个算法的鲁棒性。主要攻击类型和参数设置及模拟实验的结果如表 3所示。
表 3 几何攻击后不同算法提取水印的BER值 Table 3 BERs of watermark extracted by different algorithms under geometric attacks
攻击类型 参数设置 BER/%
TDSS DQAQT TBAQT
翻转 水平/垂直 1.56 0 0
旋转 90°整数倍 1.56 0 0
剪切 25% 2.12 0.04 0
32% 5.55 1.38 0
50% 9.63 4.84 0
遮挡 0.5 12.58 1.20 0
0.6 16.10 3.60 0
0.7 19.71 8.66 0.01
放缩 0.6 1.77 0 0
0.8 1.52 0 0
2.0 1.56 0 0
缩放 0.6 2.23 0 2.16
0.8 1.60 0 0
2.0 1.60 0 0
纵横比调整 0.8×1.4 1.62 0 0
1.8×0.7 1.63 0 0


表选项






从实验结果可以看出:
(1) 在所有情况下, DQAQT与TBAQT嵌入水印的鲁棒性都优于TDSS。原因在分析图像处理攻击实验结果的(1)中已进行解释。
(2) 针对旋转、翻转、缩放、放缩及纵横比调整等几何攻击,TBAQT和DQAQT的表现势均力敌,提取水印的BER基本都为0。这一方面得益于采用的差值量化方法能够有效抵抗这些攻击;对于TBAQT而言,更重要的是其纹理粗糙区域大小及滑动窗口移动方式的适当设置,使得获取的纹理粗糙区域在攻击前后仍然保持一致。TBAQT唯独对于缩放倍数低于0.6的图像,提取水印的能力不如DQAQT,这是因为嵌入区域本身就比图像小得多,当图像缩放到很小时,纹理粗糙区域的尺寸相对更小,导致部分水印信息丢失而无法正确提取。
(3) 剪切和遮挡攻击都是裁剪掉图像的部分像素,只是裁剪的位置有所不同。遮挡攻击裁剪中心区域相比剪切攻击裁剪左上角区域对图像影响更严重,因为一般重要信息都倾向于放置在图像的中心位置。TBAQT能够完美抵抗这2种攻击,而DQAQT在裁剪范围超过25%后BER显著上升。这是由于DQAQT将水印嵌入在完整的图像中,部分图像信息丢失必然导致嵌入在其中的水印信息无法提取;而TBAQT在多个纹理粗糙区域中嵌入相同的水印,嵌入区域在图像中占比较小且没有重叠,即便部分区域被裁剪,仍然可能存在不受影响的嵌入区域,因此使得TBAQT能够有效抵抗剪切和遮挡攻击,这也是其的优势所在。
5 结论 1) TBAQT可使嵌入水印的所有图像获得一致良好的不可见性。在实验中,100幅嵌入水印的图像与它们的原始图像之间的SSIM均高于99%,且不同图像之间的SSIM差异不超过0.5%。
2) TBAQT对于绝大多数图像处理攻击和几何攻击均表现出优异的鲁棒性。在实验中,从被攻击后的嵌入水印图像中提取的水印与原始水印之间的BER基本接近于0。
3) TBAQT在嵌入水印前首先需要定位水印的嵌入区域,因此算法的运行时间相比直接在图像中嵌入水印的TDSS和DQAQT高,后续将对如何提高算法的运行效率展开研究。生成模型[16-20]是近期受关注的热点,在未来的研究工作中也将借鉴生成模型的相关方法,对水印算法进行深入研究。

参考文献
[1] FAZLALI H R, SAMAVI S, KARIMI N, et al. Adaptive blind image watermarking using edge pixel concentration[J]. Multimedia Tools and Applications, 2017, 76(2): 3105-3120. DOI:10.1007/s11042-015-3200-6
[2] GUAN H, ZENG Z, LIU J, et al.A novel robust digital image watermarking algorithm based on two-level DCT[C]//Proceedings of the International Conference on Information Science, Electronics and Electrical Engineering.Piscataway, NJ: IEEE Press, 2014: 1804-1809.
[3] MOHREKESH M, AZIZI S, SHIRANI S, et al. Hierarchical watermarking framework based on analysis of local complexity variations[J]. Multimedia Tools and Applications, 2018, 77(23): 30865-30890. DOI:10.1007/s11042-018-6129-8
[4] YADAV N, SINGH K. Robust image-adaptive watermarking using an adjustable dynamic strength factor[J]. Signal, Image and Video Processing, 2015, 9(7): 1531-1542. DOI:10.1007/s11760-013-0607-2
[5] HUANG Y, GUAN H, NIU B, et al.A spread-spectrum watermarking scheme with adaptive embedding strength and PSNR guarantee[C]//Proceedings of the International Conference on Anti-Counterfeiting, Security, and Identification, 2018: 82-87.
[6] HUANG Y, NIU B, GUAN H, et al. Enhancing image watermarking with adaptive embedding parameter and PSNR guarantee[J]. IEEE Transactions on Multimedia, 2019, 21(10): 2447-2460. DOI:10.1109/TMM.2019.2907475
[7] NASIR I, KHELIFI F, JIANG J, et al. Robust image watermarking via geometrically invariant feature points and image normalisation[J]. Image Processing IET, 2012, 6(4): 354-363. DOI:10.1049/iet-ipr.2010.0421
[8] TANG C W, HANG H M. A feature-based robust digital image watermarking scheme[J]. IEEE Transactions on Signal Processing, 2003, 51(4): 950-959. DOI:10.1109/TSP.2003.809367
[9] YE X, CHEN X, MENG D, et al.A SIFT-based DWT-SVD blind watermark method against geometrical attacks[C]//Proceedings on the International Conference on Image & Signal Processing.Piscataway, NJ: IEEE Press, 2015: 14841650.
[10] SU Q, CHEN B. Robust color image watermarking technique in the spatial domain[J]. Soft Computing, 2018, 22(1): 91-106.
[11] ZONG T, XIANG Y, NATGUNANATHAN I, et al. Robust histogram shape-based method for image watermarking[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2015, 25(5): 717-729. DOI:10.1109/TCSVT.2014.2363743
[12] LOAN N A, HURRAH N N, PARAH S A, et al. Secure and robust digital image watermarking using coefficient differencing and chaotic encryption[J]. IEEE Access, 2018, 6: 19876-19897. DOI:10.1109/ACCESS.2018.2808172
[13] PARAH S A, SHEIKH J A, LOAN N A, et al. Robust and blind watermarking technique in DCT domain using inter-block coefficient differencing[J]. Digital Signal Processing, 2016, 53: 11-24. DOI:10.1016/j.dsp.2016.02.005
[14] HUYNH-THE T, BANOS O, LEE S, et al. Improving digital image watermarking by means of optimal channel selection[J]. Expert Systems with Applications, 2016, 62(1): 177-189.
[15] HUYNH-THE T, HUA C, TU N A, et al. Selective bit embedding scheme for robust blind color image watermarking[J]. Information Sciences, 2018, 426: 1-18. DOI:10.1016/j.ins.2017.10.016
[16] PENG Y, QI J. Show and tell in the loop:Cross-modal circular correlation learning[J]. IEEE Transactions on Multimedia, 2019, 21(6): 1538-1550. DOI:10.1109/TMM.2018.2877885
[17] PENG Y, ZHU W, ZHAO Y, et al. Cross-media analysis and reasoning:Advances and directions[J]. Frontiers of Information Technology & Electronic Engineering, 2017, 18(1): 44-57.
[18] QI J, PENG Y.Cross-modal bidirectional translation via reinforcement learning[C]//Proceedings of the International Joint Conference on Artificial Intelligence, 2018: 2630-2636.
[19] YUAN M, PENG Y.Text-to-image synthesis via symmetrical distillation networks[C]//Proceedings of the 26th ACM Multimedia Conference.New York: ACM, 2018: 1407-1415.
[20] 彭宇新, 綦金玮, 黄鑫. 多媒体内容理解的研究现状与展望[J]. 计算机研究与发展, 2019, 56(1): 183-208.
PENG Y X, QI J W, HUANG X. Current research status and prospects on multimedia content understanding[J]. Journal of Computer Research and Development, 2019, 56(1): 183-208. (in Chinese)
[21] 刘丽, 匡纲要. 图像纹理特征提取方法综述[J]. 中国图象图形学报, 2009, 14(3): 622-635.
LIU L, KUANG G Y. Overview of image texture feature extraction methods[J]. Journal of Image and Graphics, 2009, 14(3): 622-635. (in Chinese)
[22] GONZALEZ R C, WOODS R E. Digital image processing, third edition[J]. Journal of Biomedical Optics, 2009, 14(2): 029901. DOI:10.1117/1.3115362
[23] WANG Z, BOVIK A C, SHEIKH H R, et al. Image quality assessment:From error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612. DOI:10.1109/TIP.2003.819861


相关话题/图像 水印 技术 实验 视觉

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于美学评判的文本生成图像优化*
    基于给定文本生成对应图像是计算机视觉领域一项经典且富有挑战性的任务,顾名思义,即给出一句描述确定内容的文本(可描述某件物体或某个场景环境),通过一定架构的模型生成与文本内容相对应的图像,使其尽可能做到逼近现实,能够迷惑人眼的识别或一些模型的判断。该任务需要在理解文本含义的基础上,根据文本的内容构建出 ...
    本站小编 Free考研考试 2021-12-25
  • 基于边缘和结构的无参考屏幕内容图像质量评估*
    随着互联网技术的快速发展,屏幕内容图像(ScreenContentImage,SCI)被广泛应用于现代多媒体应用,如无线显示、远程教育、屏幕共享、实时通信等。由于技术和设备的缺陷,在压缩、传输、获取等过程中不可避免地会引入各种失真,影响用户的体验。例如,当利用智能手机中的相机创建屏幕内容图像时,由于 ...
    本站小编 Free考研考试 2021-12-25
  • 基于多尺度失真感知特征的重定向图像质量评估*
    人们越来越依赖移动设备进行工作和娱乐,例如可以通过展开或闭合屏幕以改变屏幕尺寸的可折叠屏幕设备。因此,如何调整图像大小以适应具有不同大小和宽高比的显示设备屏幕,成为与用户体验相关的重要问题。已经有许多成熟的图像重定向方法被提出。为了理解图像重定向方法,图1展示了原始图像以及MIT数据库中应用8个重定 ...
    本站小编 Free考研考试 2021-12-25
  • 基于深度视觉语义嵌入的视频缩略图推荐*
    随着移动互联网的快速普及和智能电子设备的高速发展,人们获取信息的方式已不仅仅满足于图像,而直接选择使用信息更丰富、画面感更强的视频,因此也带动了很多视频分享网站和APP的快速崛起,比如YouTube、优酷,以及最近两年快速流行的抖音、快手等短视频分享APP。人们越来越热衷于将自己生活中发生的事情用短 ...
    本站小编 Free考研考试 2021-12-25
  • 基于CNN的多尺寸航拍图像定位方法的研究与实现*
    航拍图像定位大多利用航拍图像的绝对定位。匹配方法中基于特征点的匹配应用最为广泛,适合匹配的特征点有边缘特征[1-3]、点特征[4-6]和区域特征[7-9]等。根据特征空间的不同,基于特征点的匹配方法分为基于特征点局部灰度区域描述符的匹配方法和基于特征点空间结构信息的匹配方法。基于特征点局部灰度区域描 ...
    本站小编 Free考研考试 2021-12-25
  • 基于SLM的模拟月壤原位成形技术*
    激光选区熔化(SelectiveLaserMelting,SLM)是随着激光技术发展及高亮度光纤激光器出现,从激光选区烧结(SelectiveLaserSintering,SLS)发展起来的一种增材制造技术。SLM利用高能束激光逐层照射预先铺覆好的粉层颗粒,使其熔化并固化成形,最终形成致密的三维零件 ...
    本站小编 Free考研考试 2021-12-25
  • 基于原始对偶内点法的EST图像重建*
    航空发动机高温、高压、高载荷的工况条件使其零部件异常磨损几率相对较高,由发动机齿轮、轴承等零部件磨损造成的故障占提前换发故障的60%和空中停车故障的37.5%。航空发动机零部件异常磨损不易被及时察觉,研究在线油液监测技术,通过实时监测滑油回路中的异常大磨粒(粒径≥40μm)监测发动机的磨损状况,对故 ...
    本站小编 Free考研考试 2021-12-25
  • 基于编解码双路卷积神经网络的视觉自定位方法*
    视觉自定位(VisualLocalization,VL)是一种通过待查询的视觉数据来获取相机位姿的方法,其在计算机视觉中扮演着重要的角色,在航天器交会对接、轨道飞行器回收空间碎片、火星漫游车等应用场景中,均需要通过视觉自定位技术获取精确的自身位姿参数。不同于从运动恢复结构(Structurefrom ...
    本站小编 Free考研考试 2021-12-25
  • 一种基于HXDSP的移位器查找表技术*
    数字信号处理器(DSP)芯片是对信号和图像实时处理的一类芯片,其具有高性能、低功耗和低成本等特点,在通信、雷达、电子对抗、仪器仪表等领域有着广泛的应用[1]。随着现代通信技术的发展,数字电视广播(DVB)、数字媒体播放(DMB)、数字音频广播(DAB)等技术的全面应用与拓展,处理器对数字信号处理领域 ...
    本站小编 Free考研考试 2021-12-25
  • 自研激光雷达三维点云配准技术*
    近年来,激光雷达三维扫描技术发展迅速,是获取空间三维信息最重要的方法之一。因为其便捷快速、测量范围广、精度高的特点,被广泛应用于数字城市、地形测绘、文物保护、自然灾害监测等领域[1-2]。传统获取物体表面三维信息的方法,主要包括基于激光雷达的三维扫描方法[3]和基于图像的三维重建方法[4]。基于TO ...
    本站小编 Free考研考试 2021-12-25