1.1 研究背景及意义
质量过硬的产品和服务是现代企业竞争力的直接体现,也是国家的综合实力之一。高品质的产品和服务是大多数公司在竞争激烈的全球市场中生存的重中之重。目前在工业过程中质量管理领域应用最多的方法之一就是统计过程控制(SPC:Statistical ProcessControl)。直到今天统计过程控制(SPC)已经成为工业过程中质量控制的重要方法。统计过程控制(SPC)是一个强大的并通过使用统计工具和常用的工具来提高产品质量技术来监测,控制和改进过程。 SPC 的目的是实现更高的产品质量,并使缺陷产品最小化,从而降低生产成本。最常用的统计过程控制工具之一是由休哈特开发的控制图。产品的质量状态是随机分布的,控制图反映了生产过程的产品质量状态特征,通常随时间的推移而表现出具有统计学意义的变化。用于实时监控过程变化,它有助于用户确定在哪一种过程状态下时间采取哪一种的类型措施方法。已知工业生产过程变化是制造业质量误差的主要来源。监测过程变化对于在过程中实现产品的最佳质量来说是很重要的,其涉及识别过程的状态,即它是否在统计控制或失控状态下运行。过程诊断就是识别失控过程变量的来源[1]。质量控制图通常受到噪声的干扰,不易于识别。本文应用神经网络集成技术对过程质量控制图的模式进行识别,也就是统计过程控制自动化系统中的监测过程,其意义主要体现在以下几个方面:大大改善了工业过程中质量信息的处理水平本文通过应用基于协同进化的神经网络集成集成技术对统计过程控制中6种基本的质量控制图进行模式识别,充分发挥了神经网络技术的可自学习、并行分布处理、联想存储、鲁棒性强等特点,提高了工业过程中质量信息的自动化,集成化处理水平。
...........
1.2 国内外研究现状
统计过程控制(SPC)是工业工程实践的一个重要领域。自从 20 世纪 20 年代休哈特提出了的控制图,该技术通过各种阶段演变已经与制造技术的进步紧密地结合起来了。控制图的关键是通过一定的方法来区分工业生产运行过程的是否在统计学上处于稳定和不稳定状态,而不稳定的状态过程可能产生不同的时间序列模式。运用工程知识对这些模式的识别能够实现过程的集中诊断和故障排除。在自动化和快速制造的现代化工业过程中标准的控制图模式几乎是不可能存在的。信息与发展计算机技术促使研究人员探索使用软计算技术,如专家系统,人工神经网络(ANN)和模糊集等方法和自动智能识别控制图的模式。各种智能识别技术在过去的二十年里有了长足的发展。但是仍然需要开发更好的识别器用于及时、准确在线识别控制图模式。随着信息技术和人工智能的蓬勃发展,很多国内外学者将神经网络(ANN)应用于控制图的模式识别中,在国际的研究中已取得了很多值得学习的成果。ANN 被视为传统统计过程控制工具的替代工具。一些研究人员试图开发 ANN 模型来检测平均值的突然变化,方差的变化或两者,其他研究人员试图开发 ANN 模型来检测和识别所有控制图表模式。Guo 和 Dooley [2]使用反向传播神经网络观察了均值和方差的正向漂移。Pugh[3-4]开发了一个反向传播神经网络来检测过程均值的突变。Chang 和 Ho [5]提出了一个由两个阶段组成的 ANN 模型,第一阶段检测过程差异变化;和第二阶段估计过程方差大小。 他们的研究类似于 R 控制图;其中当过程变化已经偏移时,R 控制图发出失控的信号。他们扩展了研究,并提出了一个集成的神经网络模型来检测突然的过程均值平移和方差平移[6]。Dedeakayogullari 和 Burnak [7]提出了两个独立的 ANN 网络,一个用于检测过程平均变化,第二个用于检测过程变化。分析这两个网络的输出以确定发生了哪个移位。 Cheng [8]结合传统 X2 控制图和 ANN 来检测多变量过程中的方差变化源。传统的广义方差图用作方差移位检测器。当产生“out of”控制信号时,基于分类器的 ANN 将确定哪个变量负责方差平移。Chena 和 Wang [9]提出了了一个人工神经网络模型来补充多元 X2 控制图。该方法识别引起信号的特性或特性组,并且当 X2 统计信号表示发生的平均移动幅值。Guh [10]提出了一种神经网络模型来识别控制图非自然模式并估计识别模式的关键参数。该模型旨在确定正常,向上移动,向下移动,向上趋势,向下趋势和循环模式。 Pham 和 Oztemel [11]是最早提出使用协同 ANN 来识别控制图表模式的好处。他们提出了一个由 MLP 和 LVQ 组成的复合模式识别系统。他们报告,基于组合识别器的结构导致比单个识别器更好的分类能力。后来 Pham 和 Oztemel [12],Hwarng [13]和 Guh等[14]提出了更复杂的设计,并使用不同的术语来描述它们的设计结构。例如组合,复合,集成,专用,模块化,协同,多个,集合,多级模型和混合识别器。尽管使用了不同的术语,但其中许多具有一些相似之处。Hwarng [13]提出了专门的识别器来识别具有循环特征的控制图。他认为专用识别系统比相应的通用系统有更高的准确性。
..........
2 相关理论基础
2.1 统计过程控制和控制图
质量控制广泛在生产和服务领域,包括商业,教育,流行病学,保健,工业和许多其他领域。它是一种统计监测技术,以科学的方式监控正在进行的过程的有效性和效率,并确保该过程充分发挥潜力。统计过程控制(SPC)是 SQC 的重要组成部分,它拥有一些放大的技术,如控制图,检查表,效果图,直方图,帕累托图,监控过程中存在特殊原因变化。SPC 通过最大限度地减少无法解释的变异性,帮助持续改进过程性能,并且有助于在自然过程存在变异性的情况下,尽早发现计划和未计划的变异。SPC 方法通常在假定样本服从正态分布的情况下独立绘制的。SPC 工具应用最多的是控制图,由贝尔实验室的休哈特于 1924 年 5月 16 日引入,将数理显著统计原理应用于统计过程控制,用来跟踪工业生产过程。随着时间的推移,控制图在质量控制中变得非常重要。正常和非正常变异是存在于任何过程中的两种主要类型的变异性。正常变化被认为是过程中固有的,即使该过程被建立和仔细地维护,而非正常的变化是可控的并且可以被检测到。过度的变化量可能引起工艺参数,即离散参数的变化。不匹配项目的数量可以由于位置参数的改变而增加,而分散参数的量的增加可能干扰处理的质量并且成为处理中的较低均匀性的原因。存在正常变化的过程被认为是控制的,否则失控,需要通过控制图进行监测。
..........
2.2 神经网络集成
神经网络是受生物神经系统的方式启发而发展起来的一种信息处理的方法,通过先验知识学习,从以前的先验知识推广到新的模型,从而做出预测。最常见的神经网络类型由三层单元组成:输入层,隐藏层和输出层。“输入”单元层连接到“隐藏”单元层,“隐藏”单元层连接到“输出”单元的层。输入层输入网络的原始信息。每个隐藏单元的输入由输入单元的输入和输入单元与隐藏单元之间的连接上的权重确定。输出单元的输出取决于隐藏单元的输出以及隐藏单元和输出单元之间的权重。图 2.4 表示多层神经网络的结构,包括输入,输出和一个隐藏层。在多层网络中,首先计算每个训练样本的预测输出,之后再计算每个预测输出和相应目标输出之间的误差。然后调整误差,使得下一次训练样本输入到网络,其预测输出和相应目标输出之间误差率相对有所降低。因此,该算法就是找出与学习目标最相关的输入的属性。在神经网络学习过程中,如果层数和隐藏节点过多或者训练时间过长,会导致模型对数据的变化很敏感,出现“过拟合”的情况,如图 2.5(b)所示。这种噪声引入的误差叫做“方差对模型误拟合的贡献”。如果模型出现“过拟合”反过来会影响模型对未来未知情况的泛化能力。另一方面,神经网络在学习过程如果结构太简单或者训练时间太短,会降低模型对数据变化的敏感性,“欠拟合”的情况,如图 2.5(c)所示。 灵活性的校正是两种类型误差之间的一种折中, 叫做偏差-方差折中。
.........
3 构建基于协同进化神经网络集成的控制图模式识别模型
3.1 神经网络集成泛化能力的理论分析..........29
3.2 基于协同进化的的神经网络集成.....30
3.3 个体神经网络的生成.......40
3.4 控制图模式识别的模型框架....42
3.5 本章小结.........44
4 基于协同进化神经网络集成的控制图模式识别仿真分析
4.1 仿真样本数据的构建与预处理.........45
4.2 基于协同进化网络集成的仿真结果及分析.......47
4.2.1 参数设置......47
4.2.2 仿真结果分析.......47
4.3 与其他方法的比较分析............50
4.3.1 与单个 BP 和 RBF 神经网络的比较分析..........50
4.3.2 与 Bagging 和 Adaboost 集成方法的比较分析.......51
4.4 实验总结.........51
4.5 本章小结.........52
5 结论及展望
5.1 研究结论........53
5.2 未来展望.........53
4 基于协同进化神经网络集成的控制图模式识别仿真分析
4.1 仿真样本数据的构建与预处理
在本文中将所有数据集分为三组:训练集,验证集和测试集。测试集用于评估训练过的神经网络集成的泛化性能,并且在整个训练过程期间没有被任何个体神经网络所使用。对于集成中的每个个体神经网络隐藏和输出节点激励函数采用 sigmoid 函数,协同进化的参数设置:在本文中神经网络集成中个体神经网络的初始连接权重在-0.5 和 0.5 之间的范围内随机选择。训练