本文是一篇计算机软件论文,论文中的第一种方案,针对于立体声音频文件,利用相邻声道之间关系特性,再将有效载荷嵌入目标声道的过程中,利用相邻声道与之相关的特性,构建预测方法,利用多个预测器产生参考预测误差,从中选择最佳的预测器对目标声道的目标音频样本进行预测,降低了预测幅度,提升预测精准度。
第 1 章 绪论
1.1 研究背景和意义
由于互联网现代化技术及通信处理技术的高速发展,人类因而迈进了信息化纪元,多媒体信息处理技术在处理和传输上也变得越来越便捷和容易操作。现代信息化时代与以前的时代技术相比,在当下时代,加速了信息的交流,从而使得现代社会技术与以前信息技术相比,发展速度要更快。但是,随之而来的是,在没有经过多媒体拥有者的允许下,不法分子对多媒体载体、产品拥有者的数字化产品进行大量非法复制并通过网络私自传播和处理,从而发生对当事人的严重侵权行为,危害了当事人的利益,侵犯了他人的权益。因此,非常迫切的需求多媒体信息安全的技术[1]。
为了解决这一方面的存在的算法问题,研究者广泛使用信息隐藏技术 (Data Hiding, DH)来实现隐秘载荷信息嵌入到目标载体中,保证多媒体文件在传输过程当中的安全性[2-3]。信息隐藏技术主要是将需要传输的有效载荷嵌入到目标多媒体载体中比如(音频和图像等)中,用户能够从目标介质中提取嵌入信息。该技术可用于多媒体文件的认证版权、在信息访问的时候确定合法身份和安全的隐蔽通信等应用方面[4]。如图 1.1 所示,是一个完整的信息隐藏系统隐藏模型,其中包含了主要的 4 个部分,分别是嵌入、提取、隐秘攻击和密钥管理。利用加密处理提高了信息隐藏系统的安全性。
1.2 国内外研究现状
1997 年,Barton针对于信息隐藏首次提出了可逆信息隐藏的概念。在这个概念中,目的是正确的认证用户的合法身份,所以该文件将用户的相关身份信息作为秘密数据嵌入到需要传输的载体中,在接收方,只有通过身份验证的合法接受方才可以准确无误的提取出系统中的信息,获取用户身份,因此该方法有效的保护了个人用户的私人信息[10]。在现在发展的可逆信息隐藏研究中,主要的算法主要有三种,早期的RDH算法以无损压缩,压缩空间嵌入信息为主,随后基于差值扩展(DE)和基于直方图平移(HS)的RDH技术被研究人员开发出来后,被广泛采用和改进,不断提升该领域目前的发展水平高度,并扩展应用范围。
1.2.1 基于无损压缩的可逆信息隐藏算法
Honsinge 等首次提出了一种基于图像认证的用于验证身份的可逆信息隐藏算法。在该方法中,数据元数据是有效载荷,利用 RDH 算法嵌入到目标图像中,使得该元数据可以在以后的时间被完全去除,以允许损失较少的原始图像恢复大体图像[11]。在这种方法中,将秘密信息填充到原始图像后取模 256 可以获得载密图像。在认证端,通过在水印图像中提取有效载荷,然后去除有效载荷的部分后可以获取原始的载体图像,对 256 进行取模是为了防止像素值产生溢出问题,从而保障信息的可逆。但是,此方法的缺点是,嵌入信息后的图像质量会受到噪声的影响,为了保证图像的质量,不会在其中嵌入较多的信息,所以导致该方案的嵌入容量较低。Fridrich 等通过将哈希值嵌入到图像中,提供了一种可逆的图像认证方法。该方法通过对图像或者其特征的最低位平面进行无损压缩,来产生空余空间嵌入秘密信息。Goljan 等首先原始图像划分为不同的块,并使用捕获块平滑度的判别函数将不同的块分为 R(Regular,规则块)、S(Singular,奇异块)和 U(Unusable,不可用块)三类。然后,然后,用 1 表示 R-块,用 0 表示 S 块,不表示 U 块, RS 向量由 R 块和 S 块组成。对于每个 R 块和 S 块,根据待嵌入的位,对块进行判别,从而更好的嵌入隐秘载荷[13]。Xuan 等利用频域整数小波变换(Interger Wavelet Transform, IWT)的原理在图像中嵌入秘密数据[14]。与之前相比,该方案在相同容量下对于载体图像可以实现更高的峰值信噪比(PSNR)值。Celik 等[15]首次提出了一种基于 LSB(Least Significant Bit,最低有效位)无所压缩信息隐藏方案,与传统的压缩方案不同的是,该方法通过对原始图像像素值进行量化,得到载体像素值的 LSB,利用 LSB 嵌入秘密信息,并将载体图像未改变的部分作为边信息承载辅助信息,提升了压缩率。Zhang 等人[16]通过递归地利用熵代码的解压缩过程来嵌入数据,并证明只要实现完美压缩,可逆信息隐藏算法的失真率就可以接近界限。然而,为了保持嵌入信息后载体图像的不可见性,被嵌入数据替换的部分通常位于像素的最低有效位,并且只能提供有限的压缩比。因此,基于无损压缩的可逆信息隐藏方案可以嵌入的有效载荷的容量是有效的。
第 2 章 可逆信息隐藏算法相关技术
2.1 基于一维直方图的可逆信息隐藏算法
直方图平移(HS)是一种改进的较为成功的 RDH 方案。通过使用 HS 的原理,首先生成需要嵌入信息的载体图像的像素直方图,根据生成的像素直方图,选取直方图零点和极值点,零点是没有像素值的直方图单元,极值点显示在直方图中就是最高的直方图单元,这样可以嵌入更多的信息,通过修改生成的直方图单元实现可逆信息嵌入。
2.1.1 基于直方图平移的可逆信息隐藏算法
2.1.1.1 直方图平移的基本思想
在图 2.1 中利用平面移动图清晰的展示了直方图平移的基本原理,蓝色的像素点是移动位,向左平移空出嵌入空间,红色的像素点为扩展像素点,不变代表嵌入二进制信息 0,向左平移代表嵌入二进制信息 1,右侧黑色像素点保持不变。最左的直方图是没有嵌入有效载荷的原始图像的像素直方图,中嵌为移动留出空间后准备嵌入信息的像素直方图,最右边的脂肪为嵌入信息之后的像素直方图。这种方法可以清晰直接的说明生成直方图时基于 HS 的 RDH 的嵌入机制:为了嵌入秘密信息,将直方图的最高点移动嵌入信息,另外一些则为嵌入空出空间更方便的嵌入信息。
2.2 基于二维直方图平移技术的可逆信息隐藏算法介绍
为了充分利用自然图像的冗余性,基于差值直方图的 RDH 方法使用具有较小差异的像素对进行展开嵌入,并使用其他差值进行移位嵌入。这些方法可以控制对每个像素值的最大修改。为了进一步挖掘像素之间的相关行,基于二维直方图平移的 RDH 算法被研究出来,Li 等人通过考虑像素对及其上下文,将局部图像区域投影到二维空间以获得由差分对组成的序列[53]。然后,通过对差分对进行计数来生成二维差分直方图,将有效载荷嵌入到二维差分直方图中。在这里以差值二维直方图的操作过程进行介绍二维直方图平移技术。
2.2.1 二维直方图差分对的构建
对于一个像素对(𝑥, 𝑦)来说,首先利用差值计算和梯度自适应预测(gradient-adjusted-prediction GAP)来计算出差值对(𝑑𝑥, 𝑑𝑦),𝑑𝑥= 𝑥 − 𝑦 , 𝑑𝑦= 𝑦 − 𝑧,z 是利用像素对(𝑥, 𝑦)周边的像素的水平和垂直变化程度计算而来。通过周边像素为像素对(𝑥, 𝑦)计算一个噪声水平值,通过噪声水平值来对不同的像素对自适应选择嵌入。
每个计算出来的差值对共有四个方向可供移动如图 2.5(a),可以向右进行平移,产生的差值对变化为𝑑1+ 1而另外一个差值𝑑2不发生变化,若向左平移直方图单元,则嵌入信息后的误差为𝑑1− 1,差值𝑑2不发生变化。若为向左上角进行平移则需要对两个差值对都修改,保证嵌入信息,在这种移动方案下,嵌入一位信息,需要对两个差值都进行修改,会产生较大的失真。而在本节方案中,引入z,这样对像素对进行向左上角或者右下角平移的时候,只需要修改一个差值𝑑2,这样保证了无论怎么移动直方图的差值单元,在嵌入一位有效载荷的情况下,只修改一个计算的差值。其移动方案如图,对计算出来的差分对根据图 2.5(b)所示的差值对映射进行秘密信息的嵌入嵌入。此差值对映射中的每个黑点都映射到一个蓝色的像素点。差值对映射用来承载一个数据位,而每个蓝点都映射到另一个蓝点,并且难以修改,以确保整体性。
第 3 章 基于一维直方图的音频文件可逆信息隐藏算法 .................... 20
3.1 音频文件双声道特性.................................... 21
3.2 基于声道相关的自适应预测器..................... 23
第 4 章 基于二维直方图的音频文件可逆信息隐藏算法 .................... 31
4.1 二维预测误差对的构建.................................. 31
4.2 二维预测误差直方图的构建.................................. 34
第