金融证券论文栏目提供最新金融证券论文格式、金融证券硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于Optuna-CatBoost算法的行业轮动多因子选股方案思考

日期:2024年12月29日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:42
论文价格:150元/篇 论文编号:lw202412270027427256 论文字数:38545 所属栏目:金融证券论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇金融证券论文,本文通过研读大量文献,找到当前量化投资选股方案所存在的问题,并将传统行业轮动策略和多因子选股策略有效结合,同时利用当前表现较好的boosting算法,经过对模型的参数优化和对个股加权等策略更新方法,最终获得收益表现较好的选股方案。

第1章绪论

1.1研究的背景

金融市场中股票投资一直是投资者关注的焦点,多因子选股作为选股策略之一,因其较强的解释能力,已被广泛应用于证券市场投资决策。其中,行业轮动多因子选股是一类常用的量化投资策略,其基本思想是,利用行业周期性的变化,结合多个行业特征指标,确定不同行业中高估值和低估值股票的选择与配置。

多因子选股策略源于Fama和French的三因子模型,该模型除了市场因素外,还引入了规模因子和价值因子,后续研究中也增加了动量、质量、波动性等多种因子。行业轮动策略则基于行业周期理论,该理论认为不同行业的成长和衰退有其内在的周期性规律。通过分析行业的经济周期位置、行业盈利能力、行业内公司的财务健康状况等多个维度的数据,投资者可以捕捉到行业的周其表现,据此进行相应的资产配置。

然而,单一的全市场多因子模型往往忽视了行业特征的重要性,即不同行业可能受到经济周期性变化、政策影响或者技术进步的影响,因此在多因子模型中加入行业轮动的策略,可以进一步提高选股的精度和投资组合的表现。并且,在传统的行业轮动多因子选股策略中,相应的行业特征指标的获取、考虑以及选取还面临着一系列的难题,包括数据质量、特征处理,以及模型选取等等。此外,从筛选因子的角度来看,需要引入新的因子以构建有效因子池,才能更好的对股市波动进行衡量,更有利于模型的构建和训练。

因此,本文旨在探讨如何将机器学习技术和行业轮动多因子选股模型结合,通过引入大数据分析、机器学习等先进技术对传统的行业轮动多因子选股策略进行改进。同时,引入新的因子构建有效的因子池,以提升股票投资策略的整体表现。

金融证券论文怎么写

1.2研究的目的和意义

1.2.1研究目的

基于以上问题,本研究旨在结合多个行业和股票指标,利用机器学习算法探究行业轮动多因子选股策略的有效性和可行性,以期为金融市场投资者提供实用性更强,科学性更为合理的选股方案。以下为具体的研究目的:

(1)确定多因子选股策略在行业轮动模式下的适用性和可行性:通过多个行业和股票指标的组合,探讨不同的多因子选股策略在行业轮动模式下是否能够取得更好的投资收益。结合历史数据和量化分析,评估多因子选股策略在不同行业、不同指标和不同时间周期下的表现,并为选股策略改进提供有价值的参考。

(2)探讨不同行业、不同指标以及不同时间周期下的选股效果和投资收益,比较各种选股策略的优劣。量化评估各个因素的贡献,并最终确定最优选股策略。

(3)借助机器学习算法,建立基于历史数据和多因子选股策略的预测模型,对未来的投资机会和股票走势进行预测分析。结合超参数优化技术,构建预测模型和较优化的投资组合,提高选股效率和投资收益。

(4)探究行业轮动因素与多因子选股模型的适合性,结合大数据和机器学习的方法,寻找更为精准的选股方式和模式。

通过筛选和优化,找到最适合的行业组合,寻找更好的股票配置组合,提高投资成功率。通过回测结果和动态实操,统计分析选股策略的实际投资收益和风险水平,进一步验证选股策略的有效性和可行性。综合以上研究成果,提供更为科学、合理、实用的选股方案和建议,为投资者提供更准确、更有效的投资决策。

第2章相关理论回顾与文献综述

2.1行业轮动相关理论

2.1.1行业轮动现象

行业轮动是指某些行业板块的股票能够更容易受到各种因素的影响和冲击,推动大盘趋势,跟随大盘的涨跌而同时进行,促使大盘进一步整体上涨或整体下跌。而在下一阶段中,由于跟随经济周期的变化、实体行业的兴衰等原因,新的行业会适时出现上升趋势,行业收益率整体较好,而之前有些表现较好的行业则会出现下跌趋势,由此可形成不同的行业板块反复成为收益热点的过程。

以上过程概括了行业轮动的基本规律,即各行业板块在不同经济周期或不同时间段内具有交替热度增长的现象。那么,经过对行业轮动的了解之后,许多投资学家利用这一规律构建不同的行业轮动策略,获得了很多表现较好的投资策略组合,这也为本文接下来的重点研究和对多因子选股策略的结合奠定了一定的理论基础。

然而,要想进一步运用好行业轮动策略,首先要做到的就是找到行业轮动规律的原因。经过以上了解,我们知道,影响行业轮动的原因有多种层面,有实体行业的兴衰和周期性发展,有宏观经济指标对投资者的预期影响等等,只有根据影响行业轮动的重点原因展开研究,才能进一步探究适合于本文投资组合的行业轮动策略的研究步骤。

2.2 Boosting算法相关理论

本文主要聚焦于Boosting算法,这是一种串行集成学习策略,近年来,在金融领域中各项投资策略的研究中以及各大平台的金融工程报告中多次运用,均表现出较好的收益结果。通过比较分析,本文预采用Boosting算法中的XGBoost、LightGBM和CatBoost算法。将这三种算法模型用于本文投资方案中,以确定哪种对本文的策略更为合适,以制定有效的投资方案。

2.2.1 XGboost算法

XGBoost算法是一种改进的决策树算法,近年来在量化投资领域的表现较好。它的特点是在每次预测时都会利用之前的错误来改进模型,这样可以越来越准确地做出预测。相比传统决策树,XGBoost算法可以处理大量的数据,具有更快的训练速度和更好的效果。

2.2.2 CatBoost算法

CatBoost算法由Categorical和Boosting组成。其中Categoricalfeatures主要优点体现在分类特征的处理上,Orderedboosting主要优点是体现在排序提升上,在解决梯度偏差和预测偏移的问题上拥有明显优势。CatBoost算法能够有效的降低模型过拟合的发生,提高算法模型整体的准确率和泛化能力。

本文选用CatBoost算法基于以下优点:①CatBoost算法在类别处理方面更有效。②CatBoost算法还使用了组合类别特征,更加适合本文中对行业类别处理。③CatBoost改进了leaf-value的计算方法,从而避免了模型的过拟合。在将每个样本的特征转换为数值类型之前,CatBoost算法首先会对所有样本进行随机排序。然后,对于类别类型特征中的每个值,它都会添加优先级和优先级权重系数,并根据排在样本之前的类别标签取平均值。

第3章问题描述与分析...........................21

3.1行业轮动策略发展现状与问题描述...........................21

3.1.1基于行业轮动规律投资的研究现状.....................12

3.1.2基于行业轮动规律投资的问题分析.....................12

第4章基于行业轮动规律的多因子选股方案设计.....................26

4.1方案策划思路...............................26

4.2经济周期划分..........................27

第5章方案合理性检验和实施建议..................................54

5.1基于行业轮动选股方案合理性检验...........................54

5.1.1回测基本假设及业绩评价指标.........................54

5.1.2投资收益分析........................................55

第5章方案合理性检验和实施建议

5.1基于行业轮动选股方案合理性检验

通过上述的参数调优与模型比较,综合来看CatBoost算法和LightGBM算法建立的模型表现在三者之间表现较好。但下文仍然对三种算法的建立的投资组合进行回测比较。

5.1.1回测基本假设及业绩评价指标

1、基本假设本文对三种模型的回测结果进行相互比较并分析,在进行模型回测之前,首先对本文的回测基本条件做出假设:

(1)对投资组合中的个股进行加权之前,本文暂定各阶段投资组合的股票权重为等权重。

(2)本文构建的投资策略采用月度调仓频率,在每月的最后一个交易日进行投资组合的重新构建。

(3)关于购买股票数额,假设各股票数额可根据投资者的意愿或实际情况购买,且暂不限制最小交易量。

(4)本文的投资策略模型考虑了交易费比率为0.0015的交易成本。

金融证券论文参考

第6章结论

6.1研究结论

本文通过研读大量文献,找到当前量化投资选股方案所存在的问题,并将传统行业轮动策略和多因子选股策略有效结合,同时利用当前表现较好的boosting算法,经过对模型的参数优化和对个股加权等策略更新方法,最终获得收益表现较好的选股方案。

首先,本文采用四个指标准确划分经济周期,根据2008年至2022年的宏观经济指标将这段时期划分为四个经济周期阶段,复苏、繁荣、衰退、萧条。然后根据所划分的经济周期找出各个分散的时间段内申万二级行业中133个行业收益率排名情况,找出在扩张或紧缩经济周期内的行业排名靠前和靠后的重复率次数,以此进一步确定了包含48个行业的初始股票池。

其次,根据这些周期性行业的基本数据,验证了行业轮动现象确实存在。同时筛选因子池,在25个基本因子中进行分析和筛选,最终选定19个因子,其中包括本文引入的新因子——pER预期收益代理。并在此基础上对初始股票池进行进一步的筛选,根据这些因子在各个行业中的回归表现和各行业在四个周期阶段中的排名,综合筛选出16个行业的最终股票池。

最后,构建行业轮动多因子选股方案。对训练集以十个月为窗口进行滚动训练,在经过首次的日度调仓后,发现回测结果不太理想,月度调仓则相对日