本文是一篇计算机软件论文,本文研究了基于混沌理论、深度学习算法和神经进化理论的混沌时间序列预测模型。研究的主要创新包括以下几点: (1)针对非线性动力系统的时间序列表现出混沌现象,根据混沌理论的相空间重构技术对混沌时间序列进行分析和进一步的预测。通过使用互信息法和 Cao法分别确定相空间重构所需的延迟时间 和嵌入维数m ,在相空间重构后,对相空间内的数据进行归一化处理,以便使用提出的模型进行空间特征和时间特征信息的提取。
第 1 章 绪论
1.1 研究背景及意义
1.1.1 研究背景
非线性动力系统在社会科学和自然科学的各个领域都有体现,诸如金融、电力、水文和天气系统等具有很明显的非线性特征。在这些常见的非线性动力中,混沌现象的出现使得预测变得更加困难。混沌的影响在不同情况下是不同的,例如,在极端天气龙卷风的情况下,其混沌现象对人类有害,需要避免或控制。但是在人类大脑活动的情况下,混沌行为对于维持大脑的正常功能是有用且必要的。因此,了解混乱并使其更好地为人类社会服务是科学研究中一项重要的任务。
在科学研究和技术运用中,测量获得的时间序列是描述一个观察系统的特征和预测其未来行为的基础。在理解过去和预测未来的动因的驱使下,人们渴望寻找到能解释观察到的现象行为的规律,从而根据规律预测观察系统的未来趋势走向。一般而言,若观察系统的有关时间序列具有线性特征,那么对其系统演化的预测较为容易,只需依靠简单的预测模型就可以获取较为准确的预测结果。但是,在实际研究中,很多被观察系统都具有非线性特征,有的系统甚至具有更难分析的混沌特征。
毫不夸张地说,宇宙中无处不存在着混沌现象。在一个混沌系统中,某一个变量在时间的流逝中会生成一个混沌时间序列。这个序列包含有关动力系统的大量信息,这对分析和理解其所在的动力系统很有帮助。对混沌时间序列的研究,就是要将其丰富的系统动力学信息抽取出来,并运用到真实的动力系统中。在科学研究中,预测混沌时间序列一直以来都是研究的热点。
在混沌理论研究的发展历程中,Poincaré被誉为是混沌研究的先驱者。在 19世纪后期,庞加莱研究了受限的三体问题,其中一个个体与其它两个个体相比可以忽略不计。庞加莱发现该简单系统的解决方案非常复杂,无法精确给出。然后在 1963 年,洛伦兹在研究天气预报中揭示了“蝴蝶效应”,因此被认为是混沌之父[1]。然而,一直到 1975 年,Tianyan 和 Yorker 才在《藏着混沌的周期 3》一文中正式定义了混沌为何物。此后,研究人员对混沌时间序列进行了广泛的研究,并引入了许多重要的概念。例如,Lyapunov(李雅普诺夫)指数,快速傅里叶变换(Fast Fourier Transform,FFT)和希尔伯特变换(Hilbert transform)以及相空间重构(Phase space reconstruction)等。
...........................
1.2 国内外研究现状
自混沌理论出现以来,以混沌理论为基础进行混沌时间序列分析和预测一直是研究人员研究的重点和热点。近年来,对于混沌时间序列预测的研究层出不穷,相关预测模型也在不断发展之中,下面将对近期国内外的研究工作进行一个大概的总结。
通过文献综述和实验研究,不难发现基于回归和移动平均模型的单一模型在时间序列的预测中取得令人满意的结果。然而,在混沌时间序列的相关研究中,由于混沌现象的存在,简单的单一模型在预测中很难取得误差较小的结果。基于混沌理论的多层感知器、Lyapunov 指数(通常使用最大指数)和域法(域,包括全局,局部及其变阶)是比较常见的混沌时间序列预测方法,但是其预测精度总是差强人意[2,3]。鉴于此,为了提高混沌时间序列的预测精度。研究人员通过将不同方法组合成混合模型,并将其应用于混沌时间序列的预测研究中。到目前为止,文献和实验研究都证明了混合模型能够对混沌时间序列进行精度较高的预测[4-6]。
结合经验模态分解(EMD)和神经网络,Tang[7]等人提出了一种较为复杂但表现较好的预测模型。利用 EMD 法将混沌时间序列分解,而后通过不同结构的人工神经网络训练不同的分解部分,该模型在一定程度上提升了预测精度。Yanan等人提出了一种基于 EMD 和 LSTM 的混合预测模型,该模型证明了基于深度学习算法与信号分解理论的组合模型在混沌时间序列预测领域具有巨大的优势[8]。结合相空间重构理论,Hoang[9]等人开发了一个基于贝叶斯回归与回声状态网络的复杂预测架构,并取得了优于其它同类预测模型的预测结果。Minghui[10]等人在 ESN 的基础上加入鲸鱼优化算法对 ESN 的网络参数进行优化。同时还提出了使用交叉验证来保证模型的泛化能力,该模型在混沌时间的预测中也取得了其它模型的预测性能。为了解决多步预测精度低,难以确定混沌时间序列的最大预测步数的困境。Caiyuan 等人则是开发了一个具有拓展功能的卷积网络和长短期记忆进行多步时间序列预测,此举为混沌时间序列监测系统的科学数据分析提供了新的参考方向[11]。
...........................
第 2 章 混沌时间序列
2.1 时间序列
时间序列,即根据时间顺序在连续相同的时间间隔上观测的数据集合。故而可以认为,时间序列就是一连串在时间维度上分散的数值。当下,时间序列研究已经在金融、水文、天气预报等诸多确定性系统中广泛开展。常见的时间序列包括:每日股票价格、每日气温和太阳黑子数等等。
一维时间上的连续性让时间序列研究有别于其它横向序列研究(自然语言处理、机器翻译等)。在其它横向序列研究中,观察结果不会按照时间排列(譬如在工资预测问题中,个体的受教育程度可用于估算人们的薪资,这种情况下相关数据可以无需按照时间顺序输入)。在经典的统计学中,对未来进行预测可称之为推理。随着时间序列理论的不断完善,研究人员将统计学中的推理命名为时间序列预测。时间序列预测根据观测的既往数值,采用合适的模型,并使用它们预测将来的观测结果。预测涉及的一个重要误区是:未来是完全不可用的,只能从已经发生的事情中对未来进行估计。
一般情况下,观测的数据决定了该使用何种预测策略。倘若无法获取观测数据,亦或是观测数据和预测任务无关,则必须使用定性预测策略。这些方法并非纯粹是猜测,而是有完善的结构化方法,无需使用历史数据即可获得良好的预测。
当满足两个条件时可以应用定量预测:(1)提供有关过去的数字信息;(2)可以合理地假设过去模式的某些方面会持续到将来。
通常情况下,大量的定量预测方法都是在特定学科中为特定目的而开发的。每种方法都有其自己的属性,准确性和成本,因此在选择特定方法时必须加以考虑。大多数定量预测问题使用时间序列数据(在一段时间内以固定间隔收集)。
..............................
2.2 混沌时间序列
2.2.1 混沌的性质
在一般认知中,“混沌”意为缺乏秩序的情境。到目前为止,学者们仍然没能够统一混沌的含义。然而,当下最受认可的一个定义,最初由 Robert L. Devaney提出[18]。一个混沌系统应满足下述三个条件:
(1)受系统的初始情况影响,且对其十分敏感。 (2)存在混沌吸引子。 (3)具有拓扑性,且混沌吸引子能够在系统中传递。 一般认为,第(2)和第(3)个条件表示了混沌系统受系统的原始情况影响,且对其十分敏感。在离散时间情况下,这对度量空间上的所有连续映射都成立。在这些情况下,通常是最重要的实际性质,“对初始条件的敏感性”不需要在定义中说明。
混沌理论是数学的一个分支,致力于研究混沌动力系统。从表面上看,混沌系统具有明显随机的无序状态。事实上,混沌系统之所以呈现出这种状态,是因为其对初始条件敏感,并受动力系统内部的确定性规律影响。作为一门跨学科理论,混沌理论指出在看似随机的复杂系统内部,其实存在着潜在的确定性联系[19]。蝴蝶效应很好地表现了混沌的基本原理,它形象地描述了复杂系统中一种状态的微小变化如何导致后一种状态的较大差异(这意味着对初始条件有敏感的依赖性)。
系统原始因素的细微不同,譬如由于测量误差或数值计算中舍入所引起的误差,也许会导致这种动力学系统的结果大相径庭,从而通常无法对其行为进行长期预测。在确定性系统中也可能出现这种状况,这表明动力系统按照着特别的规律运行。更重要的是,初始条件决定了其演变方向,且不受其它步确定因素的影响[20]。也就是说,动力系统无法预测的原因是其确定性所致。一般情况下,研究人员将其命名为“确定性混沌”。该理论首先由 Edward Norton Lorenz 总结为:混沌,用现在确定未来时,与现在近似,但未来不能由此确定[1,21]。
图 3-1 数据预处理
.......................
第 3 章 深度混合神经网络模型.............................33
3.1 数据预处理.............................33
3.2 深度混合神经网络.............................33
第 4 章 基于深度差分神经进化的预测模型................................40
4.1 差分进化算法................................40
4.1.1 差分变异................................40
4.1.2 交叉运算............