金融学论文栏目提供最新金融学论文格式、金融学硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于VMD-ML价格预测模型的股指期货量化投资策略思考

日期:2021年10月26日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:527
论文价格:150元/篇 论文编号:lw202110091256493628 论文字数:42555 所属栏目:金融学论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis
相关标签:金融学论文

本文是一篇金融学论文,本文首先针对金融时序预测问题,通过将变分模态分解以及 SVR、LSTM 两种在金融领域应用较为广泛的两种机器学习算法进行集成,提出了 VMD-ML 价格预测模型。该模型通过变分模态分解解决了金融时序非平稳且混沌的问题,通过机器学习算法的比较分析解决了单一机器学习算法对输入序列依赖以及金融时序非线性的问题。该模型不仅在设计上思路清晰,而且泛化能力较强。泛化能力主要体现在对于机器学习模型池的选取、对于预测标的的选取以及对于价格、收益率和波动率等初始输入时序等的选择上。通过与 SVR、LSTM 两种被广泛应用的机器学习算法的预测结果进行对比分析,验证了本文所提的基于 VMD-ML 价格预测模型在预测效果上的显著提升。


第一章绪论


1.1 研究背景及意义

1.1.1 研究背景

量化择时策略是根据价格变动特征进行开发的投资策略,是量化投资领域的重要分支。价格预测通常被认为是量化择时策略开发的前提和基础。经过历届学者多年的努力,已经有许多预测金融市场价格的研究方法被提出。最初,学者们使用经典的回归方法来对市场价格进行预测。随着人工智能技术的发展,其在金融研究领域中的应用越来越广泛。近年来,关于机器学习的量化投资策略也常出现在各大研究报告中。

支持向量回归和神经网络是两种被广泛应用于金融时序预测等领域的机器学习算法(ML)[1-5]。相对于传统的机器学习模型,SVR 模型可以摆脱局部最优而达到全局最优。与传统的人工神经网络不同,递归神经网络(RNN)在隐藏单元之间建立连接,可以处理前后关联的数据,非常适合时间序列的预测。长短期记忆神经网络(LSTM)是在递归神经网络的基础上提出的改进模型,它通过加入记忆单元而进一步提升了对重要信息的捕捉能力。正是由于其对历史信息强大的捕捉能力,使得其在自然语言识别、时间序列预测等多个领域得到广泛应用。但目前单纯的机器学习算法依然无法对非稳定且混沌的金融时序进行较精准的预测。

变分模态分解(VMD)是在 2014 年被美国加州大学数学系的 Konstantin 教授提出的一种新的信号分解技术。在美国、中国香港以及英国等金融市场上 VMD 分解已经被验证是一种有效的降噪方式[6]。它不仅可以实现对输入信号的降噪,而且可以有效地抑制经验模态分解中可能出现的模态混叠现象。本文将创新性地将 VMD 分解与多个机器学习算法进行结合,并将其应用于我国金融时序的预测研究中。

.................................


1.2 研究思路与方法

1.2.1 研究思路

由于金融市场价格的影响因素复杂、波动性较高,金融时序的预测一直是量化择时策略研究的重点和难点。金融时序难以预测的主要源自于其非稳定、混沌以及非线性的特性。本文针对金融时序非稳定和非线性的两个特性,分别引入变分模态分解和机器学习算法,提出了 VMD-ML 价格预测模型。首先,通过引入变分模态分解(VMD),解决了经典去噪方法无法将金融时间序列中包含的多尺度复杂模态有效分离的问题。其次,通过引入多个机器学习(ML)算法进行对比分析解决单一机器学习算法在时序预测的局限问题。在 VMD-ML 价格预测模型的基础上,本文提出了对应的量化择时策略。最后,本文分别通过对分量序列预测模型的超参数优化以及交易的仓位管理对投资策略从提高胜率和赔率的角度进行了优化。具体研究思路如图 1 所示。

图 1 研究思路

图 1 研究思路

..............................


第二章 相关理论及文献综述


2.1 时间序列预测主要方法

金融时间序列由于受经济基本面、政策、群体心理等诸多因素的影响,具有高波动、非线性、非平稳、混沌等特点。金融时序的预测也因此一直是金融领域的难点及热门研究方向。通过总结时间序列研究的相关文献,可以将时间序列预测分为周期因子分析、线性回归、传统时序建模、时间序列分解以及机器学习等方法,如图 3 所示。

图 3 时间序列预测方法分类

图 3 时间序列预测方法分类

结合金融时序高波动、非线性、非平稳、混沌等特点,本文将采用信号分解技术中的变分模态分解(VMD)对原始金融序列进行处理,解决金融时序中普遍存在的非平稳、混沌的问题;采用机器学习算法中的 SVR 以及 LSTM 模型解决金融时间序列非线性的问题。

................................


2.2 变分模态分解相关理论

小波分解(WT)、经验模态分解(EMD)、集合经验模态分解(EEMD)以及变分模态分解(VMD)等都是目前应用比较广泛的信号分解技术[7-9]。小波分解是一种同时进行时频域分析的局部化处理方法,利用基函数对原始序列进行缩放、平移将原始信号,从而将原始序列转化为若干序列的叠加。因此,小波分析具有一定的去噪和时频局部分析功能,但存在时移、频率混叠、依赖基函数的选择以及容易产生虚假谐波等缺陷[10]。N.E.Huang 等(1998)提出了一种旨在解决信号非平稳性的完全自适应的分解技术——经验模态分解(EMD)。它不仅摆脱了傅里叶变化的约束,而且避免了小波变换中对基函数依赖的问题。但是,经验模态分解也存在一定的弊端,比如经常会出现模态混叠现象。针对这个问题,Huang 等(2009)通过加入白噪声,在 EMD的基础上提出了改进算法——集合经验模态分解(EEMD)。该分解算法消除了部分噪声的影响,但当出现显著的频谱交叉时,EEMD 依然不能有效地抑制模态混叠现象。

变分模态分解是由 Konstantin 等(2014)提出了一种解决输入信号中噪声问题的分解技术,可以自适应地确定频带并估计相适应的模态。通过合理地设置预设尺度数K 的值,变分模态分解便可以有效地抑制在 EMD 分解中经常出现的模态混叠现象。Konstantin 等的实验结果显示,在对噪声的处理上,VMD 的性能明显优于 EMD,具有更显著的鲁棒性。与经验模态分解相比,VMD 在对非平稳信号进行处理时,可以更显著地抑制噪声的影响。

...................................


第三章 基于 VMD-ML 的价格预测模型研究............................23

3.1 股指期货价格序列平稳性分析........................ 24

3.1.1 沪深 300 股指期货主力连续合约收盘价平稳性分析..........................24

3.1.2 沪深 300 股指期货主力连续合约对数收益率平稳性分析..................25

第四章 基于价格预测模型的股指期货量化投资策略研究....................... 37

4.1 基于价格预测模型构建股指期货量化投资策略的思路................................ 37

4.1.1 股指期货量化投资策略背景.......................................37

4.1.2 价格预测模型的预测胜率及预测盈亏分布分析..................................37

第五章 股指期货量化投资策略的优化...................................... 45

5.1 基于超参数优化的股指期货量化投资策略胜率优化.......................... 45

5.1.1 分量序列 SVR 预测模型的超参数优化..............................45

5.1.2 分量序列 LSTM 预测模型的超参数优化........................ 46


第五章 股指期货量化投资策略的优化


5.1 基于超参数优化的股指期货量化投资策略胜率优化

在机器学习中,超参数是用于控制学习过程并提前进行设置的一种参数类型。而其他的参数(如节点权重等)则是可以通过训练自动得出的。超参数的选择会直接影响到学习的速度和质量。为提高价格预测模型的预测精度,以及进一步提升投资策略的胜率,本节针对 SVR 以及 LSTM 的超参数分别进行优化,再次重新对每一个本征模序列进行预测,并择优选取。

5.1.1 分量序列 SVR 预测模型的超参数优化

遗传算法(GA)是通过模仿生物遗传中基因的交叉、变异和自然选择来实现寻优过程的一种算法。本研究将采用遗传算法对 SVR 中的惩罚参数 C 及高斯核函数的参数gamma 进行同时寻优。GA 算法的基本思路是首先初始化一个包含若干个体的种群(population),同时对个体(individual)进行编码,将个体(individual)的表现型转换成基因型,然后对个体进行遗传(复制)、变异和选择等操作。

图 30 各分量序列的 GA 优化 SVR 超参数迭代图

图 30 各分量序列的 GA 优化 SVR 超参数迭代图

..............................


结论


本文总结

本文首先针对金融时序预测问题,通过将变分模态分解以及 SVR、LSTM 两种在金融领域应用较为广泛的两种机器学习算法进行集成,提出了 VMD-ML 价格预测模型。该模型通过变分模态分解解决了金融时序非平稳且混沌的问题,通过机器学习算法的比较分析解决了单一机器学习算法对输入序列依赖以及金融时序非线性的问题。该模型不仅在设计上思路清晰,而且泛化能力较强。泛化能力主要体现在对于机器学习模型池的选取、对于预测标的的选取以及对于价格、收益率和波动率等初始输入时序等的选择上。通过与 SVR、LSTM 两种被广泛应用的机器学习算法的预测结果进行对比分析,验证了本文所提的基于 VMD-ML 价格预测模型在预测效果上的显著提升。

同时,本文从实践的角度出发,提出了对应的期货投资策略,并从提高胜率和赔率的角度