电子信息类论文栏目提供最新电子信息类论文格式、电子信息类硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于机器学习的电子信息通用隐写分析技术研究

日期:2018年02月25日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:1712
论文价格:150元/篇 论文编号:lw201704102118399835 论文字数:36254 所属栏目:电子信息类论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis
第一章  绪论 

1.1  课题研究的背景及意义 
随着现今网络与多媒体的迅猛发展以及数字时代全面覆盖,信息在存储、传送以及交流的方式上更加丰富,人们能够随时随地地使用网络传送信息,共享信息资源,这使人们的工作、学习、生活变得方便快捷[1]。与此同时,网络的开放使用也致使许多安全隐患存在其中,信息资源遭到破坏、篡改以及丢失让人们开始注意到信息安全问题在未来生活中越来越突出。信息安全问题开始受到越来越多人的关注,自上一个世纪 90 年代提出现代信息隐藏技术以来,经过 20 多年改进与发展,它已成为信息安全领域的研究热点。 隐写术和隐写分析为信息隐藏技术两个重要的组成部分,它们两个是对立的,隐写分析是对隐写术的检测与攻击,目的是对秘密信息是否存在进行检测,并对信息进行干扰破坏,隐写分析技术在解决隐写术的非法使用方面起着至关重要的作用[2]。最近几年隐写分析技术虽然得到了快速的发展,但从总体上来讲隐写术还是领先于隐写分析技术。随着隐写技术不断改进与发展,信息隐藏的方式和数据类型越来越丰富,信息隐藏的安全性和隐蔽性也愈来愈强,现有的隐写分析算法面对不断改进的隐写算法显得无能为力。在数字图像处理领域,虽然针对数字图像方面的隐写术还未发展完善,但已提出了许多经典的数字图像隐写算法,并且大部分隐写算法现已被开发成专业的信息隐写的工具,并且可轻松的从网上得到[3]。隐写分析技术虽然也在不断改进与突破,并且有着显著的成果,但与隐写工具相比较来说,用来隐写分析的工具还非常少。我们在研究隐写技术的同时应当注意,隐写工具也可能被不法分子利用来做一些违法的事,危害社会安全,它可以为非法信息的传播提供一种隐秘安全的通信方式,隐写术的滥用,可能会引起非常严重的后果。隐写分析技术作为评估者和攻击者的发展到今天,是保证隐写术不被用来传播违法信息的关键技术,也是用来检测隐写算法性能的关键技术,得到了更为广泛的关注和研究。 
.........

1.2  国内外研究现状及发展趋势 
通用隐写分析算法由 Farid 和 Avcibas 最先提出,随后国内外众多研究人员在此领域进行了更加深入的研究工作。Avcibas 等人最先提出了基于图像质量度量(Image Quality Measures,IQM)的通用隐写分析方法[5],通过适当的图像质量度量选择以及多变量分析,来检测图像中是否被嵌入了水印。虽然人类感官感觉难以察觉到由于秘密信息嵌入造成的数字图像的细微变化,但随着秘密信息的嵌入必然会造成数字图像某些特征的改变[6]。也就是说,可以通过检测待检数字图像的某些特征有没有发生改变来判断数字图像中有没有被嵌入水印。在现实实践中,该算法有两个技术瓶颈,一是合适的度量指标的选择,二是如何能够有效的降低算法的计算复杂度。 基于小波系数 PDF 矩的方法由 Farid 等人提出[5]。首先通过正交镜像滤波的方式分解图像,总共可分为 4 个子带,然后用递归方式对低通子带进行分解。经过 3 次分解后,求出各个高频子带系数的平均值、方差、峰度以及偏度作为特征向量集,总共有 36 维;与此同时,在空间、各方向和规模上,各子带系数间可能会存在一定的相关性,因此需要根据相邻系数对每一个子带都进行线性误差预测,并且按照与前面相同的方法进行特征提取;最后通过实验证明该算法对Ezstego,Jsteg,Outguess 三种隐写算法有着不错的检测效果,实验所用的分类器是 Fisher 线性判别分类器(FLD)。在后面的研究中,该算法被用到了彩色图像的检测中,对三个通道各提取 72 维特征,可以构成一个 ??216723 维的特征向量集,实现了对彩色图像的隐写检测[5]。 
........

第二章  隐写技术与隐写分析技术研究 

2.1  隐写技术概述 

隐写术是保护秘密信息不轻易被攻击的一种有效手段,与传统的密码技术的共同点是都是保护秘密信息不被窃取[11],不同的是密码技术使用的手段是通过把秘密信息进行编码变成密文进行保护,而隐写术使用的方法是将秘密信息隐藏在另一公开载体中,一般使用图像、文字、音视频等多媒体文件作为载体,载体可以在通信信道中公开传递。在这个模型中,隐秘信息首先通过密钥转换为密文,然后通过隐写算法把隐秘信息嵌入到载体图像中,通过载体进行传递[12]。提取时通过相应水印提取算法提取出隐密信息,然后用相应的密钥解密还原出隐秘信息。 

........

2.2  典型的隐写算法 

隐写算法的种类繁多,空域隐写和变换域隐写的研究最为广泛。下面对本文所用到的几种隐写算法进行介绍。 LSB 替换隐写(Least  Significant  Bit)是最早、最简单的一种隐写算法,算法基于图像空域[13]。灰度图像通常用 8 比特二进制数来描述,将图像的所有比特位提取出来,可以形成 8 个位平面,图 2.2 给除了经典的 lena 图的位平面图,通过图可以发现图像高位平面对图像感官质量起主要作用,去除图像最低几个位平面并不会造成画面质量的明显下降,因此,用秘密信息替换图像中的最低比特位,可以很好的进行隐藏。LSB 匹配算法是 LSB 替换算法的改进算法。算法的基本思想是:当要嵌入信息比特与像素值最低位不匹配时,随机的对像素值进行进行加 1 或减 1,使得两者相等[13]。所以 LSB 匹配隐写又称±1 隐写。Patchwork 隐写算法的思想是:从待嵌入图像中选取一部分数据来构成两个集合,然后修改集合间的某种关系,以这种方式来嵌入秘密信息[14]。这两个集合可以是两个系数、两组系数或是两个特征量。两个集合之间的关系包括逻辑关系和奇偶性关系等。Patchwork 算法能够实现盲检测,这是该算法的最大优点之一,同时 Patchwork 算法的稳定性也很强。但 Patchwork 方法只能隐藏 1 比特的信息,即只能说明该图像是否存在水印[15]。 

..........


第三章  基于训练集构造的图像通用盲检测算法改进 .... 22 
3.1  隐写分析算法泛化性能分析 ....... 22
3.2  算法研究改进 ....... 28 
3.3  本章小结 ....... 29 
第四章  基于 CNN 的隐写分析算法研究 ......... 30 
4.1  人工神经网络 ....... 30 
4.2  卷积神经网络 ....... 31
4.3  实验设计 ....... 36 
4.4  本章小结 ....... 37 
第五章  总结与展望 .... 38 
5.1  论文工作总结 ....... 38 
5.2  论文进一步研究方向 ........... 38 

第四章 基于 CNN 的隐写分析算法研究 

4.1  人工神经网络 
人工神经网络(Artificial Neural Network,ANN)是机器学习一个非常重要的分支,通过数学模型把生物神经网络的工作过程抽象的表现了出来,是一种用来做模式匹配的算法[36]。通常用于解决分类和回归问题。目前比较典型的人工神经网络有感知器神经网络(Perceptron  Neural  Network),BP 网络(Back Propagation),Hopfield 网络,自组织映射(Self-Organizing  Map,SOM),学习矢量量化(Learning Vector Quantization,LVQ)[37]。卷积神经网络(Convolutional Neural Networks-简称 CNN)经过近些年的改进和突破,已经成为最受关注的神经网络之一,同时也逐渐成为研究领域的热点之一[39]。卷积神经网络不需要对图像做复杂的预处理,可以把原始图像作为输入,这一特点使得卷积神经网络的适用性大大加强。  卷积神经网络的结构主要有局部感知和权值共享两个特点,这两个特点使得卷积神经网络的运算复杂度大大降低。 经过研究发现,一般图像都存在局部稳定性,也就是说局部区域的统计特性同样适用于临近区域。因此,神经元可以分区域感知图像特征,然后把各区域的特征综合起来就可以得到整副图片的特征。图 4.3 为全连接网络,图 4.4 为局部连接网络[40]。 
.......

总结 

本文对基于机器学习的通用型隐写分析算法进行研究。主要做了如下工作: 
(1)深入研究了典型的隐写算法和隐写分析算法。隐写算法包括 LSB 匹配算法、LSB 替换算法、Patchwork 算法、STDM 算法、HUGO 算法和 STC 编码算法,隐写分析算法包括基于质量度量的分析算法、WAM 分析算法、HCF-COM分析算法、SPAM 分析算法和 Rich Model 分析算法,详细介绍了各算法的原理,并对各算法的优缺点进行了分析。 
(2)对 SPAM 隐写分析算法和 Rich Model 隐写分析算法的泛化性能进行改进。论文首先详细分析了 SPAM 分析算法和 Rich  Model 分析算法的原理,并通过实验对其泛化性能进行测试,包括隐写率失匹配测试,隐写算法失匹配测试和图像源失匹配测试。并根据测试结果提出通过训练小隐写率样本,构造