本文是一篇博士论文范文,本文围绕基于FL的可信机械设备时序信号预测研究,提出了一种基于FL的隐私保护与数据异质性处理方法,并结合深度学习技术,以提高模型在实际工业环境中的预测准确率。
1 绪论
1.1 研究背景与意义
制造业是国民经济的重要支柱,不仅是经济发展的基础,还是国家创新和提升全球竞争力的关键。特别是在高端装备制造领域,制造业对国家自主创新能力和整体竞争力具有直接影响。制造业的持续发展有助于优化我国的产业结构,推动从“制造大国”向“制造强国”的转变,为国家经济的长期繁荣和可持续发展奠定坚实基础。当前,全球正处于第四次工业革命的数字化转型关键阶段,随着“中国制造2025”和“德国工业4.0”等战略的提出,数字化技术在工业制造中的广泛应用加速了生产方式的转型升级。通过引入先进技术和智能设备,数字化转型改变了传统生产模式,提升了生产效率,降低了生产成本,实现智能化管理。
随着科学技术的迅猛发展和制造工艺的持续改进,各类科技含量高、结构复杂的设备已广泛应用于我国的工业和国防领域。现代机械设备(如航空发动机、大型锋利发电机组、精密机床和轨道交通设备等)正向复杂化、自动化和智能化方向发展,其运行环境通常具有高温、高压、高速及高精度等极端特征[1-2]。设备长期运行在日益严苛的环境条件下,不可避免地会受到疲劳、磨损、腐蚀以及老化等因素的影响,导致其性能逐渐退化。设备性能下降导致故障或失效的风险增加,这不仅会造成巨大的经济损失,还可能危及人员安全,甚至引发灾难性后果。尤其是在高端装备制造领域,如航空发动机、大型风力发电机组和轨道交通等设备中,一旦发生故障,不仅会造成重大经济损失,还可能引发严重的人员伤亡。因此,确保设备的可靠性和安全性变得尤为重要,迫切需要有效的监控与维护管理体系。
1.2 国内外研究现状
1.2.1 机械设备时序信号预测研究
时序信号预测在工业、医疗、环境和基础设施等多个领域至关重要。通过分析历史时间序列数据模式并结合机器学习算法,能够预测未来事件、检测异常和分类模式。这些分析结果有助于优化运营效率、增强决策过程、预防系统故障,并促进主动维护策略的制定和实施[17-20]。由于其重要性,以及传感器制作工艺与深度学习方法的快速发展,近年来对机械设备时序信号预测方法的研究显著增加。
机械设备时序信号预测方法大致可以分为基于模型的方法[21-22]和基于数据驱动的方法[23-25]。如图1.2所示,这两种方法各具特点,适用于不同的应用场景和需求。基于模型的预测方法通常依赖于丰富的先验知识,通过构建设备的物理和数学模型来模拟其运行状态,以实现精确预测。这类方法往往需要详细的设备参数和工况信息来提供相对准确的故障机制分析。然而,现实系统的复杂性往往是不可预测的,且难以用数学方程进行精确表达。在这种情况下,基于模型的方法可能难以提供准确的建模[21-22,26]。相比之下,随着大数据和人工智能的快速发展,基于数据驱动的预测方法逐渐受到更多关注。此类方法通过选择不同的机器学习模型,从原始数据中提取相关特征,并进行预测。与基于模型的方法不同,基于数据驱动的方法无需依赖先验知识,而是通过大规模历史数据的训练,自动学习数据中的模式和规律,尤其适用于复杂或难以建模的系统[23-25]
2 相关理论
2.1 卷积神经网络
卷积神经网络(CNN)是一种包含卷积结构的深度神经网络。其典型结构如下图2.1所示,主要由输入层、卷积层、池化层、全连接层和输出层五个关键部分构成。每一层在网络中承担着不同的功能,通过协同工作,共同构建了一个强大的特征提取器与分类器。
相比传统的神经网络,CNN通过引入卷积层和池化层,在处理高维数据方面展现出显著优势。卷积层能够自动学习并提取数据中的局部特征,池化层则进一步减少特征的维度,提升了模型的计算效率和泛化能力。正是凭借这一强大的特征提取能力,CNN已经成为处理计算机视觉问题的核心工具。不仅在图像分类、物体检测等任务中,CNN表现出色,它的应用还拓展至语音识别、自然语言处理等多个领域,展示了广泛的适应性和强大的表现力。
2.2 联邦学习
联邦学习(FL),于2016年由谷歌提出,又名联合学习,联盟学习,是一种分布式机械学习框架。传统机械学习中数据被集中在一个服务器中心进行模型训练不同的是,FL主要的思想是对于多个分布在不同设备上的数据集在不共享本地数据的情况下搭建学习模型,这样可以保护多个企业用户的隐私的同时,又利用分散在不同客户客户端的数据进行联合式的学习。FL针对要对敏感数据进行模型训练的任务十分适用,常应用于医学领域、金融领域,如医疗业中的MRI、CT、X-ray中这种需要分析大量高精度,高质量的样本数据的训练模型的场景,不同医院之间难以共享患者的医学图像的数据,使用FL框架就能很好的解决这一难题。 FL的大致流程如图2.2所示,首先在中心服务器上初始化一个全局模型,并将该全局模型发送给其服务的全部客户端。客户端接收到全局模型后,对该全局模型进行在本地进行模型训练,训练完成后各个客户端将经过自己私密数据训练得到的网络模型发送回中心服务器,中心服务器得到这些训练过后的模型后,开始对所有模型进行整合并使用聚合算法使得全局模型得到更新,聚合算法常使用联邦平均算法,通过加权平均各个客户端模型的参数来对全局模型进行更新。
在FL中,隐私是其本质属性之一,设计这个学习框架的初衷也是为了保护用户隐私。虽然用户在本地进行模型训练无需共享本地数据,避免了数据的直接共享,但在实际应用中,仍然容易出现各种的隐私泄露的风险。可能用户在上传经由本地数据更新后的模型时,可能会有攻击者会根据上传的模型参数,推断出用户的原始数据。所以,在FL中增设额外的隐私保护手段是行之有效的。其中差分隐私是联合学习中常用到的一种隐私保护技术,差分隐私通过向模型中注入无关的参数或梯度,使得攻击者即便获取了计算的结果和部分其他相关信息,也难以精确推断出某个样本的存在和具体的特征。差分隐私的引入有效的隐藏了用户端本地数据的细节,同时保持注入的无关参数或梯度在可控范围内,使其对全局模型的影响在可接受的范围。但添加的噪声应该控制在什么范畴,怎样找到对隐私保密性好又不影响全局模型精度的噪声成为了FL中隐藏保护的关键问题。
3 基于联邦学习的连续到离散的可信机械设备时序信号预测 .......... 38
3.1 引言 .............................. 38
3.2 模型描述 ...................... 39
4 基于联邦学习的联合特征排序的可信机械设备时序信号预测 ...... 54
4.1 引言 ...................................... 54
4.2 模型描述 .................................. 55
5 基于联邦学习的贝叶斯可信机械设备时序信号预测 ...................... 66
5.1 引言 ............................... 66
5.2 模型描述 ................................ 67
5 基于联邦学习的贝叶斯可信机械设备时序信号预测
5.2 模型描述
在本节中,首先介绍问题的表述,然后详细描述分布迁移模块,并全面分析预训练神经网络模型的贝叶斯不确定性校准。本章所提方法的整体架构如图5.1所示。在联邦预测过程中,服务端聚合每个参与客户端的本地标签分布,形成覆盖所有本地客户端数据分布的近似全局分布。随后,该全局分布被广播至每个客户端,以便在具有全局视角的条件下进行本地训练,从而有效应对数据异质性问题。
接下来,通过贝叶斯不确定性校准模型学习一个一致性变换模块,用于重构预训练的联邦预测模型输出y),以获取联邦预测模型中的不确定性。具体而言,首先训练一个用于时间序列预测的联邦预测模型,并固定其参数。在此基础上,训练不确定性校准模型以校准预训练模型中的不确定性。在联邦预测的整个过程中,服务器持续聚合参与客户端的本地数据分布(|;)ip z y,构建近似真实的全局数据分布p(z|y;),随后将该分布作为诱导偏置应用于各个客户端的训练。
6 总结与展望
6.1 总结
本文围绕基于FL的可信机械设备时序信号预测研究,提出了一种基于FL的隐私保护与数据异质性处理方法,并结合深度学习技术,以提高模型在实际工业环境中的预测准确率。随着工业智能制造领域的迅猛发展,在高端装备制造领域,如航空发动机、大型风力发电机组和轨道交通等设备中,一旦发生故障,不仅会造成重大经济损失,还可能引发严重的人员伤亡。机械设备的健康管理和故障预测已成为提升设备安全性、延长使用寿命、降低维护成本的关键环节。本文将机械设备时序预测应用于航空发动机RUL预测以及机械设备轴承故障诊断。航空发动机作为飞机的核心部件,其可靠性与安全性至关重要。为了更好地监控其健康状态,本文利用传感器数据进行RUL预测,旨在优化维护计划、降低成本并提高设备可靠性。
(1)本文针对现实场景中大规模标记数据集难以获得,以及不同工业企业设备间存在的数据异质性和不均衡问题,本文基于航空发动机RUL时序数据,提出了一种可信赖的FL预测方法。首先,针对连续RUL分布难以直接建模的问题,本文借鉴了电子学中DAC的思想,设计了一个CDC模块,将连续的RUL值转换为离散类别。其次,在服务器端训练了一个生成器,用于聚合所有客户端的RUL标签分布,并基于该聚合分布从全局视角生成样本的隐特征。这些隐特征包含了全局数据的信