工程管理论文栏目提供最新工程管理论文格式、工程管理硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于经验模态分解和卷积神经网络的股价趋势预测

日期:2023年06月10日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:171
论文价格:150元/篇 论文编号:lw202305291436077672 论文字数:27855 所属栏目:工程管理论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇工程管理论文,本文从对股票估值分析的回顾开始,将估值方法分类为技术分析法,股票账面价值法,量化因子法,机器学习法,逐一分析了这些方法的优势与劣势,同时展开讨论了机器学习尤其是卷积神经网络的特点,并分析金融估值场景中的机器学习模型,得出了在金融时间序列问题采用机器学习方法比原有的估值方法效果更佳。

第一章绪论

第一节研究背景与意义

2020交易年的结束,依托于中国经济的平稳成长,上海证券交易所和深圳证券交易所的总市值都大幅增长,在全球证券交易所中的排名分别上升至第3位和第7位。疫情加快了中国经济增长的相对速度,同样伴随着中国实体经济继续走稳深化改革的道路,可以预见未来的中国资本市场有望保持快速的发展,赶超世界第一。

股票市场是上市公司非常重要的直接融资渠道,股票的发行和交易直接助力实体经济,也决定着一个国家的经济金融稳定。人们把股票交易作为投资盈利的重要渠道,研究股票市场的趋势可以提升投资收益,同时防范投资风险。自从股票市场在国内开放以来,众多学者开始对股票价格波动进行研究分析,试图找寻出基本规律。传统的两大分析方法主要是技术分析和基本面分析。前者把历史数据会重演作为假设,以证券市场中的价格数据作为预测的主要对象。通过研究分析股票价格的变动趋势,结合成交量和成交价格的波动做出投资决定。后者则秉持价值投资的观点,以宏观经济情况、行业发展研究、公司经营情况等作为分析依据来评估上市企业的长期投资价值和潜在风险。

近年来大数据技术和机器学习算法解决问题的能力指数式增长,在结合了各个信息化行业后,都进一步提升了各行业的能力。其中深度神经网络的应用效果最为卓越。比如AlphaGo2017年战胜人类围棋冠军柯洁;一名来自普林斯顿大学学生毕业设计的Sketch-And-Paint GAN模型,“从无到有”临摹出高质量的中国山水画,栩栩如生骗过半数观察者;短视频巨头快手搭建万亿参数精排模型,为数亿用户推荐上百亿的视频。

第二节研究内容及方法

本文回顾金融估值方法的特点和不足,并逐一分析近来比较热门的金融深度学习模型,从中获得启发并设计一套复合模型对股票涨跌进行预测。结合经验模态分解和卷积神经网络的优势,对数据进行时间维度数据分解并以图片形式输入卷积神经网络训练。

本文将提取沪深300指数的日收盘价数据,通过经验模态分解将数据转化为多通道矩阵,代表了股票价格在不同时期尺度上的趋势拆解。将分解后的多通道矩阵数据输入卷积神经网络模型,以未来五日的涨跌情况作为输出结果,利用卷积神经网络特征提取的优势来训练预测模型,通过对神经网络超参数对训练结果的深入研究及调整,取得与传统算法比较更准确的预测模型。

第一章绪论主要介绍论文的选题背景及研究价值,简述本文的工作内容。第二章重点梳理传统股票预测方法,卷积神经网络的发展,和深度学习在量化投资中的应用。第三章讨论经验模态分解与卷积神经网络的原理。第四章阐述对原始数据进行的预处理,以及基本的模型结构。第五章讨论模型的调优,包括模型结构、卷积核的个数、卷积核的形状和大小、全连接层神经元个数、Dropout防止过拟合技术、优化器等。第六章是对全文工作的总结和展望,期望未来能够在超参数调整上取得进一步的强化。

第二章文献综述及发展趋势

第一节传统股票预测方法

作者认为,股票作为一种金融工具,具有价值和价格两个基本属性,并且价格会因为市场中的各种要素围绕价格作均值回归。因此,对于股票的预测可以分为基于价值的预测,基于价格的预测,和综合价值价格的预测。

工程管理论文怎么写

一、基于价格的股票预测技术分析法是最传统的预测方法。技术分析法主要通过各类专门的价格计算将过去的成交价格绘制成图线,然后判断股票未来的走势。主要图线有:

1、指数平滑异同移动平均线,又称MACD线;2、相对强弱指标,又称RSI线;3、随机指标,又称KDJ线;4、威廉指标,又称W&R线;5、布林线,又称Boll线。

第二节卷积神经网络发展情况

神经网络是一套结构复杂的的信息处理系统,灵感出自摹仿人类的大脑神经元组织及其功能。从最初的单层感知机,到后来的多层感知机,再到后来结构复杂参数繁多的模型,其在非线性问题上的解决能力越发强大,卷积神经网络是其中能力较为突出的。

卷积神经网络由若干个卷积层和池化层组成,同时也包括连接在尾部的全连接层。这一类型的架构可以让卷积神经网络充分利用输入信息的二维结构,在图像和语音识别等各个方面都展现出卓越的能力。由于其特殊的泛化操作,卷积神经网络相比较其他深度学习算法,训练所用参数的数量明显降低,这一点使之在海量数据学习过程中颇具吸引力。

1989年,Yann LeCun等人尝试在识别邮编的手写数字时使用神经网络算法。后来Lecun进一步开发卷积神经网络技术实现了银行支票的手写字识别,准确率高可以取代人工。

随后的1998年,Yann Lecun[39]设计出LeNet-5模型并发表论文,将逆向传播算法应用到模型的训练上,被作为是卷积神经网络的第一代原型。

2006年,Hinton等人[30]在science杂志上发表论文,提出两个重要结论:其一是深层神经网络具备突出的特征学习能力;其二,“逐层预训练”可以克服深层神经网络训练困难的障碍。接下来便引爆了人们对于深度学习的研究热度。

第三章经验模态分解与卷积神经网络理论研究.......................15

第一节经验模态分解...........................15

第二节卷积神经网络...............16

第四章模型设计与搭建.........................23

第一节实验环境......................................23

第二节数据准备.............................23

第五章模型优化与评估....................29

第一节模型优化的研究..............................29

一、权重初始化............................29

二、卷积层结构..............................29

第五章模型优化及评估

第一节模型优化的研究

一、权重初始化

神经网络的核心是计算损失函数并通过梯度下降自我更新权重降低误差,很显然权重的值是模型产出较为重要的因素。而这一重要参数的初始值,也会对模型的训练过程产生重要的影响。如果不考虑这一细节,可能会放缓收敛速度,干扰收敛结果,甚至造成空值阻断训练。

在训练前,为了不出现无法正常运行的神经元,会使用数值不相同的小随机数来初始化各网络层的权重和偏置。但是权重不宜设置得太小,这会导致梯度近似于零,无法训练。

权重太大的情况下,其对于损失函数的梯度可能发生梯度消失的情况,导致模型的训练过程被阻断,因此注意到是“小随机数”;使用数值相同的参数矩阵进行初始化,同样也会出现类似难题,模型无法正常训练,等同于丧失学习能力,因此注意到是“不相同”。随机初始化的权值和偏置的初始值范围可为[-0.5,0.5]或者[-1,1],也可根据具体的场景分配合适的区间。

为了尽可能保证模型训练过程的收敛速度和平稳结果,结合本文的数据来源与对响应变量独热编码的考虑,通过控制变量法枚举初始化的取值范围并测试效果。决定将权重使用keras.initializers中的RandomUniform进行初始化,范围选择[-0.01,0.01],偏置使用initializers.Zeros作归零的初始化。

工程管理参考参考

第六章总结与展望

第一节总结

本文从对股票估值分析的回顾开始,将估值方法分类为技术分析法,股票账面价值法,量化因子法,机器学习法,逐一分析了这些方法的优势与劣势,同时展开讨论了机器学习尤其是卷积神经网络的特点,并分析金融估值场景中的机器学习模型,得出了在金融时间序列问题采用机器学习方法比原有的估值方法效果更佳。在此基础上,考虑到经验模态分解对金融时间序列问题的有效信号分解,结合经验模态分解和卷积神经网络构建复合模型。模型以沪深300指数的日收盘价为实验数据,经过数据初始化和经验模态分解的转换,得到一年多的矩阵数据,用于预测未来五日的涨跌情况。通过对机器学习参数优化的研究,在权重初始化、模型结构、全连接层神经元数量、Dropout层、优化器、提取结束训练防止过拟合等方面进行应用,获得了61.1%的预测精确度,比传统的方法准确率更胜一筹,并且也在交易回测上取得较好的超额收益。

参考文献(略)