本文是一篇计算机软件论文,本文在区间二型模糊神经网络的研究基础上,通过将模糊集拓展至直觉模糊集,针对数据本身的构造特点、网络中的时间关联以及网络训练过程中的自发性学习等问题进行研究,主要工作如下:(1)根据所预测时间序列的特点,建立数据预处理环节。研究原始时间序列本身所蕴含的内部联系,将单一数据映射到多维度模型,探究数据在不同维度所表达的运动趋势。通过对数据在多维度走势的分析,寻找原始数据中可能受到干扰的数值并进行针对性处理。从而在保留时间序列主体特性的基础上,获取更易操作的时间序列,为后续研究的展开提供便利。(2)为更适应复杂的现实数据,对模糊化环节进行扩展。系统构造的过程中引入了犹豫度的概念,将模糊集扩展至直觉模糊集,在模糊化环节使用隶属度与非隶属度两种判别方法对数据进行处理,从而获得更高的有效信息传输率和更可靠的语义描述,进而提高预测模型的准确率。
第一章 绪论
1.1 研究背景及意义
时间序列是对研究对象进行时间维度上的采样得到的数据集合,它体现的是研究对象随时间的动态变化[2]。时间序列在现实生活中普遍存在,如音频数据按照时间的顺序记录、股票价格随着时间实时变化、对于气候的观测依据时间进行记录、心电图按照时间规律波动等。由于观察对象、应用场景以及使用目的的不同,可以按照不同的时间刻度对数据进行划分。而对时间序列进行研究,可以揭露事物间的客观联系。例如,根据气候随时间的变化规律划分四季并制定节气,从而更加科学地开展农业和畜牧业;根据地质随时间的演变情况研究岩层的构成并加以对比,揭示板块运动过程探索人类生命起源;根据行星随时间的位置变化建立天体运动模型,探索宇宙的奥秘寻求新的生存空间。亘古至今,人类对于时间序列的探索从未停止,而这些研究成果也为人类的生存与发展提供了更大契机。
随着大数据技术的兴起与发展,数据的处理与应用受到广泛关注,可供研究的时间序列也呈现出爆炸式的增长。在工业生产过程中,通过建立时间序列预测模型,对可能发生的故障问题进行预测,能够有效地降低设备维护成本提高生产效率[3]。在对能源消耗情况的研究中,对再生能源的发展情况进行建模分析,能够清晰地发现能源发展存在的问题,为政府的战略发展规划提供科学依据[4]。在交通运输的监管中,对交通流进行聚类研究预测未来流量变化趋势,在完善管理模式和提高突发状况的处理效率上具有重要意义[5]。在旅游行业发展中,通过分析旅客流量数据,对季节性特征进行深度挖掘,进一步发现隐性季节特性,能够指导城市做出合理的旅游规划[6]。在电力系统建设中,通过模拟风电出力过程中存在的时间相关性,能够达到优化风电系统运行的目的[7]。在人类健康与环境污染的研究中,通过对妇女儿童的电子病历分析,研究在大气污染中的暴露时间与早产风险之间存在的关联,从而为孕妇群体制定健康的出行意见[8]。在卫星系统建设中,对GPS基准站坐标的科学分析,不仅能够显著提高站点空间的响应程度,而且提高了对我国地壳形变特征的认识[9]。在重大事故处理中,以时间为基准为危险化学品泄漏事故进行建模,对未来可能发生的事故进行预测,为积极采取预防措施及迅速开展灾后救援赢得时间优势[10]。针对时间序列的研究成果已经应用于我们生活的方方面面,它正在逐渐地改善着我们的生活,也将为未来提供无限可能。
............................
1.2 国内外研究现状
因为时间序列本身具有时序关联,所以时间序列往往存在数据量大、维度高、变化快等特点。这些特点为研究提供大量数据支撑的同时,也增加了算法的复杂性,成为研究的障碍。随着时间序列研究的发展以及相关研究的逐渐深入,一些跨学科的研究者从不同角度提出了基于混沌理论的模型[11][12],神经网络[13][14],支持向量机[15][16]和K-近邻元预测[17][18]等模型。这些建模方法可以通过对历史数据的有效处理来分析和挖掘时间序列的潜在规律,并对其进行概率性的预测。
然而现实世界中的数据往往是不能准确表述的,如数据受多方面干扰所存在的不精确、数据采集过程中带来的误差、专家经验描述引起的沟通不畅等,这些不确定性最终都将导致所获取知识的不确定性。1965年,L.A.Zadeh提出模糊集理论(Fuzzy Sets,FS),为处理不确定性信息奠定了基础[19]。这一理论在模糊推理、模糊逻辑以及模糊控制等众多领域得到了广泛应用。为解决实际应用中固有的不确定性的级别,1975年,Zadeh引入了二型模糊集(Type-2 Fuzzy Sets,T2FS)的概念[20]。与原有模糊集相比,它能够极大地减少基于规则的模糊逻辑系统不确定性影响,可以更大限度地处理模糊问题。因为二型模糊集的成员等级本身是模糊的,这使得它们能够灵活地适应不确定性的环境。在二型模糊集的支撑下,以模糊神经网络为代表的模糊推理方法得到了迅猛发展。
在此基础上,新的模糊神经网络学习方法也不断被提出。2006年,Theocharis以模糊神经网络为基础提出了一种高阶递归神经模糊系统,在线调整模型的结构和参数[21]。同年,李培强等人以非机理模型为切入点,提出减法聚类模糊神经网络,使负荷建模的精度和收敛速度得到了显著提升[22]。2008年,Juang和Tsao提出了在线聚类方法与模糊集简化方法,在灵活分割空间的同时避免了模糊规则的重叠[23]。2010年,Juang等人提出了一种带局部反馈的递归自进化模糊神经网络,该网络使用卡尔曼滤波算法和梯度下降算法分别对后续参数和前件参数进行学习[24]。2015年,Das等人提出了一种数据驱动的中间值减少方法使推理快速而准确,在使用结构自动演化的同时,使用元认知对内部参数进行更新[25]。
..............................
第二章 相关理论
2.1 区间二型模糊神经网络
由于不确定性因素的影响,人类无法获取完全纯粹的信息,理想的数学模型难以直接服务于现实数据。1965年,Zadeh提出模糊集理论[19],该理论建模非线性关系与不确定的信息,以此来捕获人类的经验或知识。模糊集理论的提出为处理模糊数据奠定了基础,在众多领域中得到了广泛的应用,如模糊推理[32]、模糊逻辑[33]及模糊控制[34]等。在模糊集理论的支撑下,数学理论的适用条件从精准数据扩展到模糊信息,这为数学在现实问题中的应用提供了更大的空间
为处理实际应用中固有的不确定性的级别,1975年,Zadeh提出二型模糊集的概念[20]。二型模糊集作为一种信息粒的表述方式,能够较好地解决表述歧义与数据噪声问题。与原始模糊集相比,它极大地减少了基于规则的模糊逻辑系统不确定性影响,能够更大限度地处理模糊问题。二型模糊集的隶属关系是具有不确定性的,这使得它们能够灵活地应用于模糊对象。这种灵活性提供了一个决策边界,并且与人类的决策十分相似。以二型模糊集理论为基础的推理系统能够直接对数据中不确定性进行建模,比如噪声数据和不同的单词含义,因此区间二型模糊集受到了人们的广泛关注[35-38]。
模糊神经网络是将模糊逻辑与神经网络进行有机组合的一类学习模型,它在处理模糊信息的基础上,具有更优秀的自学习能力与并行处理能力。近年来,针对模糊神经网络的研究受到关注,其性能在模糊回归、模糊专家系统以及模糊矩阵方程等领域都得到了印证。尤其,伴随区间二型模糊集理论的发展和成熟,针对区间二型模糊神经网络的研究备受瞩目。与传统模糊神经网络相比,区间二型模糊神经网络能够获得更为精确的判别效果,具体表现为在模糊处理过程中,将对于模糊值的计算扩展到对模糊区间的计算。
...........................
2.2 直觉模糊集
1986年,Atanassov将模糊集的概念扩展到直觉模糊集(Intuitionistic Fuzzy Sets,IFS),将元素x的隶属关系和非隶属程度考虑到一个模糊集,并提出了犹豫度的概念[43]。在处理问题时,直觉模糊集同时考虑了隶属度、非隶属度以及犹豫度三方面的信息,可以描述中立状态的模糊特性,从而提供了比模糊集更灵活的捕获信息的能力。可以说,在不完全确定的事实和拥有不精确知识的情况下,直觉模糊集是一种更人性化的推理工具。因此,自直觉模糊概念提出以来,有关直觉模糊集理论的研究就受到研究者的广泛关注。直觉模糊集凭借其良好的信息捕获与语义表述能力,已经在医疗诊断、模式识别和市场预测等诸多领域得到了良好的应用。
继直觉模糊集这一理论的提出,专家学者陆续发掘了L型直觉模糊集、直觉模糊“与”、“或”算子及直觉模糊逻辑命题等方法,将直觉模糊扩展为一个系统性的研究领域[46-48]。近年来,直觉模糊集仍然被广泛运用于各领域的研究中,2018年,Yazdi使用直觉模糊混合逼近理想解相似排序法提出一种更加完备的风险评估技术,该技术能够使用语言表达专家意见来处理风险矩阵的局限性和群体决策者的不确定[49]。2019年,Zhan等人将直觉模糊集和粗糙集相结合,构造了一个模糊的粗糙框架,为信息系统中不完全信息的建模和处理提供更灵活的解决方法,该方法在决策问题中得到了良好的应用[50]。实践表明,直觉模糊集理论在系统应用中表达能力强,适用范围广,值得继续探讨研究。
.............................
第三章 基于元认知的区间二型 LSTM 直觉模糊推理系统 ............................. 12
3.1 引言 ....................... 12
3.2 系统概述 ..................