计算机软件论文栏目提供最新计算机软件论文格式、计算机软件硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于深度学习的行人重识别计算机软件方法研究

日期:2020年08月28日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:1041
论文价格:150元/篇 论文编号:lw202008191609591063 论文字数:31696 所属栏目:计算机软件论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇计算机软件论文研究,本文基于现实生活场景中行人姿态多变,遮挡现象频繁发生的设定下,利用了深度学习方法对行人重识别问题进行了探究,本文主要的工作内容如下:1、介绍了当前行人重识别技术各种角度的研究方法,并且对这些方法的创新点和利弊进行了具体地分析。2、详细论述了本文提出的一种高效、轻量级的基于混合注意力机制的特征融合网络HAF2N,该网络模型的设计动机是,一方面通过引入少量姿态估计的监督信息对行人人体结构进行局部划分,进而在硬性注意力机制的规范下提取精细人体局部特征。另一方面,使用卷积神经网络提取行人全局特征,然后通过软性注意力学习挑选全局特征图中重要的细粒度像素。特征融合网络通过将局部和全局特征融合,形成了区分行人身份的特征表示,并以此用来完成行人图像检索和排序。3、本文提出了一种基于硬性注意力机制的局部特征提取方法。该方法能够从输入的行人图像中提取到更加精细的人体部件特征。首先,通过姿态估计工具对行人进行关节点定位,将行人身体进行局部区域划分(RP 和 NP),然后将硬性注意力模块分别应用到 RP和 NP 的特征图上,通过硬性注意力学习,在人体局部特征图上可以定位潜在具有判别力的区域,提取轮廓更加精细的人体部件特征。该方法能够排除无关背景噪声干扰,同时在一定程度上缓解了人体相邻部件之间的遮挡问题。


第一章  绪论


1.1  研究背景及意义

近年来,经济的快速发展带来不同地域间的人员频繁流动,这成为了各地方维护公共安全的重要隐患。面对大量刑事案件和治安案件,公安干警需要将大量时间用于基础视频数据的检索和搜集,更由于时效性等原因增加了案件的破获难度。因此,在安防亟待升级的当下,基于监控视频设备进行的精准定位、目标识别和比对等智能侦查技术,已经成为了新形势下维护国家安全和社会稳定的重要侦查手段。尽管基于关键特征点定位的人脸识别技术已经成熟落地并且广泛普及使用,但是其对实际使用场景有着较高的要求,如设备像素、卡口角度位置、距离、光线等客观条件对人脸照片的获取均存在较大影响,复杂的实际环境也会造成识别率的大幅下降。在人脸识别失效的情况下,行人重识别技术就成为了一个非常重要的替代品技术。而将人脸识别技术与行人重识别技术相结合,能够实现更多维度的智能侦查手段,这极大地提高了原有基础设施的再利用价值。因此,在公共生活中,行人重识别作为人脸识别的补充和延伸,对安防升级和提高公安系统案件侦破技术能力具有重要意义。

行人重识别技术(Person Re-identification,  简称 Re-ID)也称行人再识别技术,在社会生活中,该技术通常与行人检测和行人追踪技术相结合,是一种“跨镜追踪”技术。具体而言,行人重识别技术的研究场景是现实生活中无重叠区域的公共监控摄像网络,研究目标是跨越不同的监控摄像头来识别、寻找特定的目标行人。从计算机视觉的角度定义,行人重识别技术属于图像检索分支下的子命题。给定一张某摄像头拍摄到的目标行人的监控图像(或视频序列),
Re-ID 根据行人外观在视觉上的相似度,能够检索出该目标行人在其它摄像头中出现的图像(视频序列)。 

....................


1.2  国内外研究现状

有关行人重识别技术的研究最早可追溯到二十世纪九十年代中期,研究者们借鉴、引入了一些图像处理、模式识别领域的成熟方法,侧重研究了行人可用特征、简单分类算法。早期关于行人重识别的研究主要是手工设计行人特征的传统方法,然而提取行人特征的过程较为繁琐而且准确率不高,因此研究进展缓慢,停滞不前。如图 1-1 所示,根据行人重识别系统中特征提取和特征相似度量两个阶段,早期研究方法围绕特征表示和度量学习两方面展开。一直到 2014 年,随着深度学习的快速发展,尤其是卷积神经网络在计算机视觉中的出色表现,关于行人重识别技术的研究已从手工设计特征的传统方法过渡到基于深度学习的方法。通过卷积神经网络提取鲁棒、有判别力的特征成为了行人重识别领域研究的热点。与传统方法相比,基于卷积神经网络的模型能够以黑盒的方式进行特征提取,同时在效率和准确率上都有显著的提升。本文的国内外研究现状将从传统方法和深度学习方法两部分展开介绍和分析。

图 1-1  行人重识别系统

.........................


第二章  行人重识别技术的相关研究


2.1  卷积神经网络基础介绍

在各种深度神经网络中,卷积神经网络是应用最广泛的一种,它由 2019 图灵奖获得者之一的 LeCun 在 1989 年提出[34],最早被成功应用于手写字符图像的识别。2012 年,深度卷积神经网络 AlexNet[35]网络在图像分类任务中取得了亮眼的表现,此后卷积神经网络高速发展,被广泛应用于计算机视觉等领域中,在多个研究问题上均取得了突破性进展。 卷积神经网络借鉴了人类理解图像时的过程和原理,通过网络结构中的卷积和池化层自动学习图像在多个尺度上的特征。人在认知图像时是分层进行的,首先理解的是颜色和亮度,然后是边缘、角点、直线等局部细节信息,接下来是纹理、形状、区域等更复杂抽象的信息,最后形成一个完整物体的概念。

视觉神经科学之前对于视觉机理的研究已经证明了大脑的视觉皮层具有分册结构。眼睛将看到的物体成像在视网膜上,视网膜把光学信号转换成电信号,传递到大脑的视觉皮层(Visual Cortex),视觉皮层是大脑中负责处理视觉信号的部分。1959 年,David 和 Wiesel进行了一次实验[36],他们在猫的初级视觉皮层内插入电极,在猫的眼前展示各种形状、空间位置、角度的光带,然后测量大脑神经元放出的电信号。实验发现,当光带处于某一位置和角度时,电信号最为强烈;不同的神经元对各种空间位置和方向偏好不同。这一实验证明了这些视觉神经细胞具有选择性。

..........................


2.2  卷积神经网络结构概述

典型的卷积神经网络由卷积层、池化层、全连接层构成,为了便于直观理解,本节以最早提出的经典卷积神经网络 Le Net-5[37]为例,如图 2-1 所示,对其网络结构进行概述和分析。

图 2-1 LeNet-5 网络结构图

整个网络的输入为 32×32(32 表示像素块的个数)的单通道灰度图像。第一个卷积层 C1 作用于输入图像,使用 6 个 5×5 像素的卷积核,得到 6 张 28×28 像素的特征图像。第二层是池化层 S2,对输入图像进行 2×2 像素的池化操作,得到 6 张 14×14 像素的图像。

第三层是 C3 卷积层,使用 16 个 5×5 像素的卷积核,通过卷积操作得到 16 张 10×10像素的输出图像。这一层的每个卷积核作用于 S2 层输出图像的部分通道。

第四层是池化层 S4,对 C3 卷积层的图像进行 2×2 像素的池化操作,得到 16 张 5×5像素的图像。第五层是卷积层 C5,卷积核的大小仍然是 5×5 像素,一共 120 个,每个卷积核作用于上一层的图像,得到 120 个 1×1 像素的图像。 

..........................


第三章  基于混合注意力感知的特征融合网络 .................................... 23

3.1  计算机视觉中的注意力机制介绍 ............................ 23

3.1.1  空间转换网络 ............................ 24

3.1.2  挤压-激励网络 ............................. 25

第四章  实验分析 ................................. 35

4.1  数据集和评价标准 ............................ 35

4.2  实验细节 ................................ 36

4.3  与行人重识别先进方法对比 ......................... 36

第五章  总结与展望 ........................ 45

5.1  总结 ................................ 45

5.2  展望 ............................. 46


第四章  实验分析


4.1  数据集和评价标准

为了评估我们的方法以及与 state-of-the-art 方法进行比较,我们选择了三个在行人重识别 中 使 用 频 次 较 多 的 大 型 公 开 数 据 集 Market-1501[52] 、 DukeMTMC-ReID[18],[24] 、CUHK03-NP[53],[54],关于数据集的训练图像实例见图 4-1。  表 4-1 中展示了我们用到的这三个数据集的详细数据信息,包括:训练/测试行人 ID 数,图像数,图像标注方法以及测试设定。对于实验结果的评估,我们使用了 Rank-1 和平均精确率 mAP 作为度量方法,关于 Rank-1 和 mAP 等行人重识别评价指标,本文已经在 2.5 节中进行了介绍。

表 4-1  实验使用的数据集

.......................


第五章  总结与展望


5.1  总结

在这个万物互联的社会中,信息安全和智能安防越来越凸显其重要性,关于行人重识别技术的研究便是其中一个基于现实社会生活设定的学术问题。随着社会进步,科学技术日新月异,行人重识别技术在学术上的研究与探索也日趋贴近社会的需求和人民群众的