专业控制工程毕业论文范文篇一
第一章 绪 论
1.1 课题研究背景及意义
目标检测及跟踪是计算机视觉领域与模式识别领域中的主要研究方向之一,经常应用在行人运动分析、机器人导航、事件检测、异常检测、视频会议、视频监控、智能交通等行业。 智能犯罪、恐怖袭击等安全问题已经受到广泛关注。然而由于人工监控还存在很多局限,如耗资昂贵、劳动强度大、人力资源有限、人工失误等问题[1]。由于时间约束、资源危机及犯罪技术的多样化,使得人工监控存在很多困难,这同时也给智能视频监控提供了机遇。 图像处理是以图像或视频作为输入,将图像相关的特征或参数作为输出的一种数字处理方法。视频监控即监督目标的行为、活动及其异常情况,以达到起到影响、引导和保护的目的。目标跟踪也就是目标的定位过程,即在连续的视频序列中对运动目标进行匹配关联,其目的是在视频序列中确定每一帧中目标的运动状态(如位置、速度、方向等),为后续操作(目标行为分析、理解和决策等)提供一定的依据。 近年来,多目标检测与跟踪技术得到了快速发展,也相继出现了很多检测与跟踪的方法,但由于环境等因素的限制,大部分算法在跟踪精度和稳定性方面仍存在一定的局限性。一般在目标相对比较少的环境下,跟踪性能较好,而在密集场景下对多目标进行跟踪时,易受到周围相似目标的干扰,造成目标漏检或误检等问题,特别是在目标快速移动或突然变向的情况下,跟踪变得尤为困难[2]。
..........
1.2 国内外研究现状
视频是由基本结构:单元场景、镜头和帧组成,其中帧是指由摄像机拍摄的单一图像,当许多图像连续快速播放时便构成无缝视频。运动目标检测,即从给定的视频帧中分割出感兴趣的目标区域,运动目标检测可认为是目标识别和目标跟踪的基础,其主要目的是在每一帧图像中检测出前景运动目标或首次出现在图像中的目标。智能视频分析主要包括三个阶段:目标检测阶段、目标跟踪阶段及目标行为分析阶段。 传统的运动目标检测方法如图1-1所示,大致分为三种形式:背景差分法(Background difference)、帧间差分法(Frame difference)以及光流法(Optical flow)。背景差分法[3]是对运动物体进行检测的最常用的方法之一,其算法步骤如下:首先初始化背景模型,然后比较当前帧与假定的背景模型的差异,即用当前帧的每一个像素值减去背景帧相对应的像素值,得到差分图像,再对其进行阈值化处理,获得运动前景图像。传统的背景差分方法的性能主要受动态背景、光照变化或阴影干扰等环境因素的影响,为了克服这些缺点,相继出现了许多改进的背景差分算法,例如:并发性背景建模,本征背景建模、高斯混合背景建模、核密度估计背景建模(KDE)、滑动高斯平均背景建模及时间中值滤波背景建模。
............
第二章 目标检测与跟踪技术
目标跟踪即定位视频序列中的目标,广泛应用于人机交互、安全、监控、视频通信、交通控制、公共场所(如机场、地铁站、群体性事件等)等。智能视频分析的框架大致分为:目标表示、特征描述、运动分割、目标分类及目标跟踪。
2.1 目标表示
目标即人们感兴趣的物体,如鸟、森林或动物园中的动物、飞机、车辆流量控制、行人等。目标可以根据其形状和大小来表示。图 2-1 显示了目标表示的几种形式[20]。其中,(a)为质心(即几何中心)表示法,(b)为多点表示法,(c)为矩形框表示法,(d)为椭圆表示法,(e)为部件表示法,(f)为骨架表示法,(g)为轮廓表示法,(h)为边界表示法,(i)为目标区域表示法。目标表示方法大体可分为两种:基于目标形态的表示方法、基于目标外观特征的表示方法。
...........
2.2 特征描述
特征即与图像属性相关的具体信息,如边缘、点、纹理等。在复杂场景中,只利用图像的单一特征并不能提供图像数据的完整信息,因此为了提高跟踪准确率,常采用多特征融合的目标跟踪算法。大部分基于颜色信息的目标跟踪算法一般选用对象的 HIS 颜色模型,它对光照变化不敏感。基于 RGB 颜色模型进行检测的效果更好,然而 RGB 特征对光照的变化较为敏感。 尺度不变特征变换(SIFT)用于提取目标的局部特征,主要用于灰度图像。同颜色特征进行比较发现,边缘特征受光照变化影响不大。纹理特征也广泛应用于特征描述,但要消耗额外的计算时间和处理步骤。此外,我们还可以提取生物特征、光流特征等作为目标特征描述子。 (1)颜色特征:在图像处理中,RGB(红、绿、蓝)颜色特征空间用来表示颜色。文献[21]利用的是结合 RGB 颜色特征和轮廓特征的粒子滤波的目标跟踪方法。颜色一般受光谱功率分布与表面反射特性这两个物理因素的影响。HSV 颜色空间由色度、饱和度以及亮度组成,对噪声较敏感。 (2)边缘特征:边缘检测是用来识别图像强度的变化。文献[22]利用了基于 3D 模型的算法进行目标跟踪,该算法使用边缘点作为特征选择。
...........
第三章 基于俯视场景的行人检测算法研究 .......... 17
3.1 基于 Kinect 采集图像 .......... 17
3.2 彩色图像与深度图像预处理 ........ 18
3.2.1 彩色图像校准 ....... 18
3.2.2 深度图像去噪 ....... 19
3.2.3 行人运动目标提取 ........ 20
3.3 俯视行人潜在位置检测 ....... 21
3.4 基于人头半径展开图 HOG 特征和 SVM 的人头判别 ........... 29
3.5 人头最终判定 ..... 34
3.6 本章小结 .... 36
第四章 俯视行人跟踪与计数算法的研究 ..... 37
4.1 基于 KF 和 KNN 俯视行人跟踪算法.... 37
4.2 基于多特征融合的俯视行人跟踪算法 .......... 40
4.3 俯视行人计数 ..... 42
4.4 俯视行人跟踪计数实验 ....... 45
4.5 基于改进的 DCT 轨迹优化算法 ........... 48
4.6 本章小结 .... 54
第五章 基于 MFC 的软件设计与实现........... 55
5.1 系统框架 .... 55
5.2 Open CV 简介 ...... 55
5.3 系统界面 ............ 56
5.4 基于 MFC 的演示效果及结果分析 ....... 57
5.5 本章小结 .... 59
第五章 基于 MFC 的软件设计与实现
5.1 系统框架
本文系统框架主要包括图像预处理、俯视行人检测(非极大值抑制算法、随机霍夫变换、径向对称变换)、俯视行人跟踪、俯视行人计数四大模块。经搭建系统框架并实现各个模块,来验证本文所采用的目标检测与跟踪算法的有效性。其系统框架如图 5-1 所示。Open CV(Open Source Computer Vision Library,开源计算机视觉库),是基于 C/C++的图像处理函数库,主要应用领域有:物体识别、人机互动、图像分割、人脸识别、运动跟踪等。 Open CV 主要分为五大模块:CV 模块、CVAUX 模块、CXCORE 模块、High Gui 模块及 ML 模块,如图 5-2 所示。其中,CV 模块是核心函数库,主要包括模式识别、图像处理、运动检测和跟踪、摄像机标定等基础的计算机视觉和图像处理算法;ML 模块,即机器学习函数库,包括很多基于统计学的分类学习方法和聚类学习方法;High GUI 模块,即 GUI 函数库,包括图像的输入、输出显示等函数;CXCORE 模块,即数据结构与线性代数库,包括很多基本的数据结构和相关函数。CVAUX 模块,即辅助函数库。
..........
总结
目标检测与跟踪是计算机视觉和模式识别领域具有一定的实用价值,主要应用于视频监控、行人运动分析、机器人导航、事件检测、异常检测、视频会议、智能交通(交通安全分析)等领域。本文针对双目视觉传感器 Kinect 场景中俯视行人检测与跟踪技术做了比较全面的研究,取得了一定的研究成果,主要工作如下:
(1)对图像进行预处理,包括彩色图像校正、深度图像修补、运动目标提取及形态学处理。针对彩色图像与深度图像在空间位置上的不匹配问题,即由于 Kinect 三个镜头空间位置分布不同而引起的图像差异,本文采用三对三仿射变换进行补偿,以期达到更为理想的效果。针对深度图像中存在的空洞问题,即深度图像中存在很多像素不确定的点,本文利用改进的联合双边滤波器对深度图像进行修补,以获得更为真实的、准确的深度图像。再利用背景差分算法提取运动目标,最后进行形态学处理,从而保证运动目标检测与跟踪的精度。
(2)本文针对深度图像中俯视行人的特点,分别采用非极大值抑制算法(Non-Maxim