本文是一篇计算机论文范文,本研究针对垃圾焚烧领域中的垃圾及吊车夹爪实时检测和垃圾燃烧实时检测问题,提出了一种基于YOLOv7改进算法和U-Net算法的研究方法。改进后的YOLOv7算法融合了Swin-Transformerv2主干网络、基于HorNet的递归门控卷积以及SimAM注意力机制[19-21],显著提高了目标检测精度[14]。
1绪论
1.1研究背景与研究意义
随着我国综合国力的不断壮大,工业现代化进程快速发展,人民生活水平逐步提高,与此同时,本研究也面临着一个日益严重的问题——城市固体废物产生量的激增,伴随着消费水平的提高,生活垃圾的产生量不断攀升,城市对环境的压力也随之加大。为了应对这一挑战,本研究需要寻求一种高效、环保、可持续的垃圾处理方法,从而改善城市环境和促进经济社会的可持续发展。据国家住建部公布的数据,2019年中国城市化率超过60%,城市固体废物交付量达到2.42亿吨,是1949年的30倍,全国每年产生的城市生活垃圾量近2亿吨,且仍在以8%~10%的速度逐年增长,预计到2025年,每年产生的城市固体废物将达到22亿吨,到2050年将增加到34亿吨。这种趋势已使近三分之二的中国城市陷入“垃圾围攻”的困境,现有的垃圾处理管理系统面临严重负荷。若不能及时采取有效措施,这一问题将不仅限制社会经济的发展,还将给人们的生活带来广泛的负面影响。
我国垃圾的可回收率很高,许多垃圾可在处理过程中被回收和再利用,然而,目前我国城市生活垃圾处理仍以填埋和焚烧为主要方式,城市生活垃圾的增加和滞后的处理方法对城市环境造成负面影响,国家发改委等部门就关于加快推进城镇环境基础设施建设也下发了相应的指导意见与通知,明确提出2025年城镇环境基础设施建设主要目标:生活垃圾分类运送能力达到70万吨/日左右,城镇生活垃圾焚烧处理能力达到80万吨/日左右,城市生活垃圾资源化利用率达到60%左右,城市生活垃圾焚烧处理能力占无害化处理能力比重达到65%等要求。由此不难看出我国城市生活垃圾处理速度低于实际增长速度,其主要原因还是在于传统的堆肥、填埋和焚烧等处理方式已无法满足垃圾处理需求。
1.2国内外研究现状
1.2.1国内研究现状
在垃圾检测及火焰检测领域,Li Xiangtai[15]等人利用计算机视觉技术,手动提取颜色和纹理等数据特征,实现了实验室环境的垃圾检测。Yuan Yuhui[16]等人利用基于深度学习的YOLOv3[33]、RetinaNet和Faster R-CNN三种技术完成自制的数据集进行垃圾识别对比实验,结果表明数据集在Faster R-CNN上具有更高的可靠性和准确性。文献[5]针对YOLOv3对小尺度目标辨识度低的问题,使用GIoU代替原有的IoU,并通过K-means聚类算法优化锚框尺寸,最终搭建了面向瓶罐识别的网络模型,在YOLOv3的基础上进行模型改进,最终比原模型在精度及效率提升4%。2019年阿里巴巴旗下的机器学习平台天池上线了垃圾检测项目,吸引了国内外众多团队参赛,天池作为目前国内最大的机器学习类竞赛网站,给垃圾检测走向智能化提供了非常不错的环境。王文豪等人[54]提出了一种基于自适应增强的径向基函数神经网络(RBFNN)进行烟雾检测的方法。该方法将火灾初期烟雾的静态和动态特征作为网络输入,通过结合多个普通分类器来提高算法的分类能力。此外,随着训练迭代次数的增加,识别烟雾的能力逐渐增强。张为等人[53]在YOLOv3特征提取网络中加入了空洞卷积和稠密卷积神经网络结构,这种改进提高了对不同尺度火焰图像的检测精度,并有效地降低了误报率。据统计,目前有关垃圾图像的目标检测算法比较少,总体来说,实现垃圾图像分类的方法都是在目标检测算法基础上进行或改进的。目标检测算法的准确性和实时性对垃圾检测系统的检测性能起着决定性作用,目标检测算法通过提升精度同时提升检测速度来加快可回收垃圾检测系统对垃圾识别精度越来越高。
2相关理论描述
2.1目标检测算法研究
计算机视觉的主要问题之一是物体检测任务,即在图像或图像序列中对物体进行准确定位和分类。然而,目标检测的实现过程存在很多干扰因素,除了图像本身的目标物的训练外,同时还存在目标物被遮挡、目标所处光线不好等等多种不同场景,许多科学家研究并改进了目标检测算法以消除这些因素。
传统的目标检测算法一般分为以下三个步骤:(1)目标定位方式选择:首先,检测目标位置,使用不同比例和长宽比的滑动窗口查看图像或图像序列,然后使用穷举策略裁剪所有可能包含检测到的目标的位置。(2)特征提取:在目标区域提取视觉特征候选人,例如SIFT(尺度不变特征变换)[2],HOG(直方图定向梯度)[3],Haar[4],LBP(局部二进制模式)[5])和其他特征提取运算符进行特征提取。(3)目标分类:根据提取的特征,利用分类器对目标进行分类。最常见的分类器是DPM(可变形部件模型)[6]Adaboost[7],SVM(支持向量机)[8]等。虽然传统的目标检测方法在检测方面取得了一定的成功,但也有固有的缺点。在区域选择阶段,使用滑动窗口选择候选区域的策略有一些缺点,如高时间复杂性和冗余窗口,降低了后续特征提取和分类的性能。由于目标本身和成像环境的因素,人工特征生成方法存在一些问题,如可靠性低、通用性差、检测精度低[9]。传统的目标检测方法已不能满足高目标检测性能要求。
2.2图像分割算法研究
(1)FCN
最早的图像分割深度学习算法主要采用滑动窗口法对目标进行分割,这种方法会产生大量冗余的候选区域,计算成本高,且重复计算次数多,效率低;此外,图像块的大小直接影响到分割的准确性,具有一定的局限性。FCN的主要思想是构建一个只包含卷积运算的网络,其中可以插入任何大小的图像,经过有效的推理和学习,可以得到相同大小的输出。此外,但FCN的缺点也不小,因为FCN的逐个像素分类忽略了单个像素之间的关系,没有考虑全局的上下文信息。结果是混乱的,因为图像细节被直接的8倍、16倍和32倍扩展所忽略了。
(2)U-Net
除了FCN,图像分割的另一个经典网络是Ronneberger等人提出的U-Net[9],它也是医学图像分割任务中使用最广泛的网络。U-Net与FCN结构类似,它没有全连接层,而是由卷积层和池化层组成。U-Net的结构如图7所示,它包括一个下采样部分、一个上采样部分和一个跳跃连接部分。下采样部分主要用于从图像中提取简单的特征,而上采样部分有更多的卷积层和更宽的检测域,提取的特征也更加抽象。
3 基于YOLOv7 的垃圾检测算法 ............................ 13
3.1 YOLOv7 算法的网络结构 ........................ 13
3.1.1 高效聚合网络 ............................... 13
3.1.2 模型缩放 ................................ 15
4 基于 SMSTHN-YOLO 的垃圾检测算法 .................. 25
4.1 基于Sim AM注意力机制的改进 ........................ 25
4.1.1 网络架构 ............................. 25
4.1.2 校准模块 .................................... 26
5 基于U-Net的火焰燃烧检测算法 .......................... 42
5.1 U-Net算法的网络结构 .............................. 43
5.2 U-Net训练模式 ................................ 44
5.3 基于U-Net算法的火焰燃烧检测算法 .................... 44
5基于U-Net的火焰燃烧检测算法
5.1 U-Net算法的网络结构
网络结构如图21所示,它由一个收缩路径(左)和一个扩张路径(右)组成。收缩路径对应于一个典型的卷积网状结构,它包括两个3x3卷积的多重应用(无填充卷积),每个卷积后都有一个线性校正单元(ReLU)和一个最大2x2的合并操作,步长为2,以减少采样。在每个还原步骤中,本研究将特征通道的数量增加一倍,扩展路径的每一步包括对特征图进行平滑处理,然后进行2x2卷积("平滑卷积"),将特征通道的数量减半,合并后的特征图与还原路径的相应反转,以及两次3x3卷积,每次都是ReLU,由于每次卷积都会丢失边缘像素,所以要进行修剪,最后一层使用1×1卷积,将每个64分量的特征向量分配给所需数量的类,该网格由23个卷积层组成,为了确保输出分割的连续映射(见图23),必须选择输入顺序的大小,使所有最大的2x2聚类操作都应用于大小为x和y的层。
6总结与展望
6.1总结
本研究针对垃圾焚烧领域中的垃圾及吊车夹爪实时检测和垃圾燃烧实时检测问题,提出了一种基于YOLOv7改进算法和U-Net算法的研究方法。改进后的YOLOv7算法融合了Swin-Transformerv2主干网络、基于HorNet的递归门控卷积以及SimAM注意力机制[19-21],显著提高了目标检测精度[14]。同时,利用基于U-Net的算法有效地处理了垃圾燃烧实时检测任务。本研究主要研究内容如下:
(1)为了实现对垃圾及吊车夹爪和垃圾燃烧的准确检测,本研究自建了两个数据集。第一个数据集包含2667张图片,其中包括垃圾和吊车夹爪的目标检测任务。第二个数据集包含2778张图片,用于垃圾燃烧检测。这两个数据集涵盖了丰富的场景和目标样本,为算法的训练和评估提供了