第6章 结论与展望
6.1 结论
我国建筑业规模发展迅速,建筑业总产值表现出良好的发展潜力。识别建筑业总产值的关键影响因素,提升总产值预测模型的准确率,对指导政策调整、产业高质量发展具有重要意义。机器学习作为一门综合了统计学、概率论、数值计算、最优化理论等的多领域交叉学科,能够为建筑业总产值预测提供一种新的思路和方法。本文重点研究了特征选择和预测模型两个方面,基于机器学习的原理和算法对这两个方面进行了研究与改进。相关结论可简要概括如下所示:
(1)基于随机森林模型的建筑业总产值影响因素筛选。针对通过经验选取的模型输入变量缺乏客观性、且预测精度低的问题。本文汇总归纳了建筑业产出相关可量化指标,从建筑业的发展规模、经济效益、生产要素、技术创新、资源环境五个维度选取17 个具体指标,构建了建筑业总产值影响因素指标体系。基于随机森林算法筛选出地区生产总值、勘察设计机构单位数、建筑业能源消费总量等共10个影响因素作为预测模型的输入变量,并得到各影响因素的重要性排序。经实验表明,随机森林算法可以选择出较好的输入变量,为建筑业总产值预测奠定了基础,最终能够有效的提升预测模型的准确度。
(2)构建BP神经网络和GSM-SVM建筑业总产值预测模型。传统预测方法对小样本、不稳定、非线性时间序列的预测精度较低。本文基于湖北省建筑业相关数据,构建了BPNN、GSM-SVM两种机器学习模型,对1995~2020年湖北省建筑业总产值进行测算,并通过对比分析本文模型与已有模型、传统预测模型的性能。结果显示,GSM-SVM2、BPNN2预测模型的预测精度、稳定性均优于已有模型和传统预测模型,更符合实际发展趋势,从而验证了本论文所提出的GSM-SVM2、BPNN2模型在建筑业总产值预测研究方面的可行性和有效性。
(3)PSO-SVM湖北省建筑业总产值预测模型的设计与实现。采用粒子群算法,对支持向量机的核函数参数g和惩罚因子C两个核心参数进行优化,构建PSO-SVM建筑业总产值预测模型。实验表明,基于粒子群优化算法能够更快、更优的得到SVR的最优参数组合,PSO-SVM预测模型可以很好的跟踪建筑业总产值的变化规律,比现行的总产值预测方法更为准确,是一种高效合理的预测方法,在经济增长预测领域中具有一定的推广应用价值。
参考文献(略)