第一章绪论
1.1课题研究背景和意义
上世纪1980年代后期,反向传播算法(即Back Propagation算法,简称BP)的出现及其在人工神经网络学习过程中的应用13],极大推进了机器学习的发展,引领了基于统计机器学习模型的发展浪潮。这个热潮一直延续至今。研究人员发现,反向传播算法的采用,可以使人工神经网络模型在训练过程中自动修正自身参数,使得网络模型能够更大程度拟合训练数据,从而通对使用大量的训练样本对神经网络进行训练学习得到统计规律,以预测未知事件的可能。和以往基于人工规则的方式相比,这种基于统计规律的机器学习模式在诸多方面显示出极大优越性。尽管这个时期的人工神经网络也可以称为多层感知器(MultilayerPerceptron) [4],但实际上它是一种浅层模型只包含一层隐藏层节点。
1.2国内外研究现状
从2009年开始,微软亚洲研究院的语音识别专家们和深度学习领军人物Hinton取得合作。2011年微软公司推出了基于深度神经网络的语音识别系统,这一成果将语音识别领域已有的技术框架完全改变[18]。采用深度神经网络后,样本数据特征间相关性信息得以充分表示,将连续的特征信息结合构成高维特征,通过高维特征样本对深度神经网络模型进行训练。由于深度神经网络采用了模拟人脑神经架构,通过逐层地进行数据特征提取,最终得到适合进行模式分类处理的理想特征。深度神经网络建模技术,在实际线上应用时,能够很好地和传统语音识别技术结合,语音识别系统识别率大幅提升[19]。
国际上,谷歌也使用深层神经网络对声音进行建模,是最早在深度神经网络的工业化应用领域取得突破的企业之一。但谷歌的产品中使用的深度神经网络架构只有4-5层,与之相比百度使用的深度神经网络架构多达9层,正是这种结构上的差别使深度神经网络在线学习的计算难题得以更好的解决。这使得百度的线上产品能够采用更加复杂的神经网络模型这种结构差异的核心其实是百度更好地解决了深度神经网络在线计算的技术难题,因此百度线上产品可以采用更复杂的网络模型。这对将来拓展大规模语料数据对深度神经网络模型的训练有更大的帮助。
…………
第二章人工神经网络和卷积神经网络的结构及算法
2.1人工神经网络
在计算机科学和相关领域中,人工神经网络是模拟动物中枢神经系统(特别是大脑)的计算模型,使得机器能够像人脑一样进行学习和识别信息。神经网络是通过大量相互连接的神经元进行计算,通常用来对输入和输出之间的复杂关系进行建模,或者用来探索数据的内在模式。
在上图中我们使用圆形来表示神经网络的单个神经节点,其中带有“+1”标示的圆是神经网络的偏置节点,或者叫做截距项。神经网络最左边一层称为输入层,最右边的一层称为输出层。中间一层称为神经网络的隐藏层,它^由处于中间位置的所有神经节点组成。这是由于不能在神经网络训练过程中直接观测到它们的值。上图所示神经网络包含3个输入节点(偏置节点不计算在内),3个隐藏节点和一个输出节点。
2. 2卷积神经网络
卷积神经网络(CNN)是多层感知器(MLP)的变种。由生物学家休博尔和维瑟尔在早期关于猫视觉皮层的研究发展而来。我们知道视觉皮层的细胞存在一个复杂的构造。这些细胞对视觉输入空间的子区域非常敏感,我们称之为感受野,以这种方式平铺覆盖到整个视野区域。这些细胞可以分为两种—类型,简单细胞和复杂细胞。简单细胞最大程度响应来自感受野范围内的边缘刺激模式。复杂细胞有更大的接受域,它对来自确切位置的刺激具有局部不变性。
……………
第三章基于手写数字识别的卷积神经网络性能研究......... 23
3.1 MNIST手写数字识别库简介........ 23
3.2卷积神经网络构造和改进方法......... 23
第四章卷积神经网络在交通标示识别中的应用........... 34
4.1卷积神经网络和多层感知器相结合的交通标示识别系统......... 34
第五章总结和展望............. 49
5.1工作总结............. 49
5.2展望 .............50
第四章卷积神经网络在交通标示识别中的应用
道路交通标示识别是智能交通系统的重要组成部分,它对车辆行驶过程中道路上出现的标示信息进行采集和识别,及时对驾驶员做出提示或警告,在紧急时刻直接控制车辆的操作,以预防交通事故的发生,保证行车安全[38]。它是车辆智能化和自动驾驶技术的重要软件支撑,具有重要的理论意义和实用价值。
4. 1卷积神经网络和多层感知器相结合的交通标示识别系统
和文献[40]比较,本系统对卷积神经网络的实现最大的不同在于使用了最大池采样层来替代子抽样层。在文献[41]对卷积神经网络的实现中,这些层被池抽样和均化操作取代,相邻的像素在卷积时被跳过,以达到降釆样的目的。最大池采样层的输出是由尺寸为(尺-,尤》大小的非重叠矩阵取最大值得到的。最大池采样提供了局部位移不变性,通过因子对输入图像的每一个方向进行降釆样。本实验中,最大池采样是通过一个2x2滤波窗口作用在特征图像区域,提取窗口中的最大值作为采样特征,对特征图像进行降采样。
4. 2基于多列深度卷积神经网络的交通标示识别系统
我们在上一个实验中的卷积神经网络的基础上进行改进构建一个深度卷积神经网络用于交通标示识别问题。深度卷积神经网络的基本架构和卷积神经网络相同,都是由一系列卷积层和最大池层交替组成,每一层只和前一层的神经元节点相连接,分层的特征提取将原始图像的输出转化成一维的特征向量,再经过2层全连接层进行分类。不同的是我们对它的训练过程进行了优化,初始化参数的设置也更有利于交通标示识别问题。所有的参数在训练过程中通过最小化误分类概率进行优化。
...........
第五章总结和展望
5. 1.工作总结
我们将改进的卷积神经网络应用于交通标示识别问题中,用大样本对卷积神经网络进行训练,取得了良好的识别效果。同时我们将通过使用人工特征提取的样本训练的多层感知器和卷积神经网络相结合,改善了识别性能。由于人工特征提取需要大量的时间和计算量,使得神经网络的训练更加困难,并且在识别过程中,由于特征提取耗费了一定的时间,使得实时性大大降低。我们基于自适应增强的思想构建了一个多列卷积神经网络用于交通标示识别,每一个卷积神经网络都是通过原始图像进行训练,使得系统适时性大大增加,同时也提高了识别准确率。
5.2展望
本文将卷积神经网络应用于交通标示识别系统,取得了很好的识别效果。但是由于影响交通标示识别的因素很多,在自然条件下获取的交通标示识别图像收到光照,畸变和遮挡等诸多因素的干扰,使得在实时应用中获取的图像模糊,残缺,难以辨识。如何能够在自然条件快速获取完整,高质量的图像信息,对交通标示进行更准确的定位仍然需要进一步的研究。
………
参考文献(略)