MBA论文范文栏目提供最新MBA论文范文格式、MBA论文范文硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于LSTM模型的上证综指价格预测MBA研究

日期:2020年04月07日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:1072
论文价格:150元/篇 论文编号:lw202004022043502902 论文字数:38544 所属栏目:MBA论文范文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇MBA论文范文研究,本文的主要研究内容是基于现代金融学经典理论和中国股票市场实际情况,从理论上设定了三因素预测模型。基于此,选取适宜的代理指标后构建 LSTM 预测模型进行实证分析,并通过网格搜索算法实现对超参数的调优,以此提高预测精度。通过比较不同信息源下各模型的预测准确度,研究 LSTM 模型在股指预测技术上的实用价值并侧面证明投资者情绪与货币政策对股市的影响。


第一章 绪论


1.1 研究背景

自 1990 年上海证券交易所正式成立以来,中国股票市场走过了 29 年极不平凡的风雨春秋。随着我国改革开放事业的不断发展,国民经济水平的不断提高,中国股票市场已经实现了从零到数十万亿交易规模的巨大突破。据统计,截止至 2018 年 6 月,我国股票市场的总市值已经达到 53.89 万亿,约为中国 2017 年全年 GDP 的 65%。

股票市场作为金融行业支柱之一,承担着资本集聚和流通的作用,是我国最重要的直接融资渠道,直接关联投资者与实体经济,是资本市场的主要部分和典型形态,其风险与波动一直是学术界研究的重点对象。早期,在股票价格预测领域应用最为广泛且成熟的是时间序列分析方法。其中,自回归移动平均模型 (ARIMA)和广义自回归条件异方差模型(GARCH)是该领域中最经典的两个模型。但是,由于股票市场与社会经济发展关系密切,其价格的波动不仅受到市场自身各种因素的影响,宏观环境也在时时刻刻深切的影响着股票价格的变化。并且,无论是内部因素还是外部环境,其对股价的影响机理均复杂多变。因此,基于统计学理论,对数据分布有严格假定的计量模型在有关股指预测的研究上始终无法取得较好的效果。具体到国内,当前,中国股票市场政策市和散户市特征明显,投资者主要为普通个人,并未达到欧美股市的弱势有效市场形式,货币政策以及普通投资者的噪声交易都对中国股票市场起着极为重要的作用。因此,利用传统的计量经济学模型,依靠噪声较高的股票历史交易数据来进行股票价格预测的研究进展有限。

........................


1.2 研究意义

股票价格预测是指根据前一时间段股票的相关信息,如历史交易数据、国家货币政策等,基于有关股票价格波动的现代金融学理论和一定的计算机技术,实现对下一时段股票价格涨跌情况的预测行为。有效地股票价格预测,不仅可以指导投资者的股票投资行为,有效提升股票市场服务实体经济能力,而且可以考察金融风险波动,为国家对股市进行宏观调控有重要的指导作用和现实意义,从而促进经济社会的平稳发展。股票价格预测领域的两大经典模型——自回归条件异方差模型(ARCH)模型和向量自回归(VAR)模型的提出者罗伯特·恩格尔(RobertF.Engle)和克里斯托弗·西姆斯(Christopher Sims)均分别获得了诺贝尔经济学奖,这充分证明了,股票价格预测无论是在国家经济发展,还是在科学研究方面都有着举足轻重的地位。

上海证券综合指数(以下称上证综指)于 1991 年 7 月 15 日发布,它的样本股是上海证券交易所全部上市股票,反映了上海证券交易所所有上市股票价格的变动情况,是中国股票市场上最重要的指数之一。上证综指因其成分股范围广,总市值规模大等特点,在一定程度上能够反应我国股票市场的总体走势,是我国经济运行的晴雨表。本文根据有关股票价格波动的现代金融学理论,结合中国股票市场实际情况,从理论上建立了三因素预测模型:Pt+1=f(交易信息 t,投资者关注与投资者情绪 t,货币政策 t)。在此基础上,选用 LSTM 神经网络技术,基于收盘指数序列构建 LSTM-0 模型,基于三类因素的综合指数构建 LSTM-1 模型,基于三类因素所有原始代理指标建立 LSTM-2 模型,进行超参数调优,提高各模型预测能力。一方面探讨该类新型神经网络模型在股票价格预测这一非线性难题上的适用情况;另一方面密切结合中国股票市场的实际情况,考察我国货币政策、投资者关注和投资者情绪等信息对股票价格波动的影响,通过尝试建立一个较为高效、准确的股票价格预测模型,为投资者进行投资操作和国家的股市调控提供参考。

..........................


第二章 文献综述


2.1 股票价格影响因素相关研究

股票价格的波动由股票的价值所决定,但同时受许多其他因素的影响。由于股票内在价值的相对稳定性和可预期性,所以一般地看,影响股票市场价格的因素主要有以下几个方面:一、宏观因素;二、产业和区域因素;三、公司因素;四、市场因素。本文是对上证综指的收盘指数进行预测而非具体的公司股价预测,因此抛开较为微观的产业和公司因素,主要着眼于宏观经济因素和市场因素的影响。

2.1.1 市场因素

现代金融学中,有效市场假说和行为金融学是解释市场因素影响股票价格波动的两大理论体系。 (1)有效市场理论 (a)理论介绍

股票价格的研究起源于 Gibson 于 1889 年提出的观点,他认为如果市场的竞争是充分的,当有可进行投资的证券时,市场的相关信息会决定其价格。1900 年,Louis  Bachelier 对股价首次采用几何布朗运动来刻画,基于统计学研究股票的收益情况,发现股票价格波动的期望总是为零。Kendall  (1953)潜心于股票价格的序列相关分析,最终得出股价呈现随机漫步的形态。早期的研究视角多为股票价格波动的观察和实证分析,未形成经济学理论。直到Osborne(1959)从布朗运动原理出发,考察股票价格和市场信息之间的关系,提出随机漫步理论[1]。其后,尤金.法玛(1965)在论文中提出了有效市场假说[2],并于 1970 年把有效市场假说的研究成果进行系统的梳理,真正建立和完善了这一假说的理论框架[3]。该理论认为,如果一个股票市场竞争充分,信息披露规范,那么其当前时刻的价格已经完整、准确的反应了市场中有价值的信息。

根据法玛的研究理论,资本市场被分为以下三种形式:

①弱势有效市场

若市场效率达到弱势有效,则新的市场价格已经反应了过去的股票价格信息,说明投资者已经充分地利用过去的成交价和成交量等信息来决定自己的投资行为。换言之,即当股票市场达到弱势有效状态时,采用任何的技术手段对股票的历史行情数据进行分析以获取超额利润都是无效的。

②半强势有效市场

股价已经充分反应了公司所有的经营情况的信息,包括依据目前公司的经营情况而对未来的利润所做的预测。在该市场状态下,依据基本面分析也无法对股票进行有效的预测。

③强势有效市场

该类市场中,所有信息,包含未公开的信息都已经被股价所反应。这点与现实世界并不符合,无法达到,因此并不是学术界研究的重点。

.................................


2.2股票价格预测方法相关研究

股票价格的预测方法可以分为定性分析和定量分析两种。

定性的分析方式即基本面分析法,它是一种依靠金融从业者经验的主观分析方法,主要适用于在相对成熟的股票市场进行周期相对较长的股票价格预测。本文是对上证综指的日度收盘指数进行数值预测而非价格涨跌的趋势判断,因此主要着眼于定量分析方式的文献梳理。

定量的分析方法基于不同视角,分为以下几类:

(1)基于统计学的分析方法

以统计学为基础,通过数学推导构建模型进行预测分析,在股票价格预测领域应用最为广泛且成熟的是时间序列分析方法。Box 和 Jenkins 于 70 年代初提出的自回归移动平均模型 (ARIMA)和 Bollerslov 在 1985 年提出的广义自回归条件异方差模型(GARCH)是该领域中最经典的两个模型。

使用时间序列分析方法对股票价格进行预测的研究有,Akgiray(1989)使用 GARCH 模型对美国股市的三大股指日收益率进行拟合和预测,发现该序列具有二阶相关性[40];宫嘉成和沈美琴(1995)在使用 ARMA 模型预测股票价格时研究了模型阶数的选择机制,从而取得了更好的预测效果[41]。张思奇等(2005)利用 ARMA-ARCH-M 模型对我国股票市场的收益率的进行了预测,说明了风险溢价具有时变性[42];万建强和文洲(2001)对比了 ARCH 模型和 ARIMA 模型在香港股指预测问题上的适用情况,研究显示 ARCH 模型对易受投机和政治因素影响的香港金融市场价格波动的描述能力更好[43];卢怀营(2013)运用 ARIMA 模型对沪深 300 指数进行了预测和分析,结果表明该模型对股市的短期波动有着一定的预测能力,但无法捕捉异常波动信息和长期走势[44]。吴玉霞和温欣(2016)建立 ARIMA 模型对创业板市场进行了短期的价格预测,研究显示该模型在股票价格预测上有一定的实用价值[45]

.............................


第三章  模型设计 .............................. 15

3.1预测模型的理论框架 .................................... 15

3.1.1  历史交易信息影响 ..................................... 15

3.1.2  投资者非理性影响 ............................. 16

第四章  数据采集及处理 ..................................... 32

4.1描述性统计 ................................... 32

4.1.1  历史交易信息代理指标 .................................. 32

4.1.2&n