(2)决策树生成
根据选择的最优特征,将数据集划分为多个子集,并为每个子集生成一个新的节点。然后,递归地对每个子集重复这个过程,直到达到某个停止条件(如预设的树的最大深度、叶子节点的最大数量、节点划分不纯度的阀值等)。在这个过程中,每个节点都对应一个特征,每个分支都对应该特征的一个取值,每个叶子节点都对应一个类别。
6 结论与展望
6.1 研究结论与建议
6.1.1 研究结论
本文首先对中国对外承包工程业务发展的历程与背景及相关研究文献进行了详细的调研,发现在对外投资快速发展的同时,东道国存在多维度的环境因素不确定性,这些东道国风险引起中国企业对外承包工程市场规模的波动,导致中国对外承包工程市场投资价值的动态变化。
其次,本文通过对东道国国家风险进行识别,并结合中国对外承包工程的行业特征、风险指标数据的可获得性以及不同风险指标对各个东道国的适用性,从经济、社会、政治三个维度出发,构建出本研究的东道国风险指标体系。其中包括经济维度的6个子指标:GDP,人均GDP,GDP增长率,货物和服务进口总额占 GDP 的百分比,外国直接投资净流入总额占 GDP 的百分比,年通货膨胀率;社会维度的6个子指标:教育公共开支总额占GDP的百分比,失业率,国土面积,人口密度,城镇化率,城镇化增长率;政治维度的4个子指标:是否为 “一带一路”共建国家,法律权利力度指数,公共部门透明度、问责性和腐败评级,因战死亡人数。共计3个一级指标,16个二级指标。东道国风险指标体系有助于中国对外承包工程企业在进入海外市场时,从经济、社会、政治等多个维度出发评估东道国的综合投资环境。
最后,根据构建的东道国风险指标体系所确定的16个解释变量,以及一个被解释变量——中国对外承包工程市场投资价值,收集并处理得到1757条有效研究数据。通过对变量数据进行深度学习,构建了决策树、随机森林、朴素贝叶斯、ExtraTrees、梯度提升树(GBDT)、XGBoost六种中国对外承包工程市场投资价值预测模型。通过交叉验证对预测模型的性能进行评估对比,发现随机森林、ExtraTrees、GBDT和XGBoost这四种模型的预测性能良好,决策树模型性能较为良好,朴素贝叶斯模型性能不够理想。同时得到了影响中国对外承包工程市场投资价值的东道国关键性风险因素:国土面积;城镇化增长率;GDP;城镇化率;人口密度;公共部门透明度、问责性和腐败评级;人均GDP;失业率。其中,部分风险因素与标准普尔、惠誉、IWEP等传统国家风险评级机构的研究所确定的国家风险因素具有一致性,如:GDP;公共部门透明度、问责性和腐败评级;人均GDP;失业率。除此之外,本研究的实证结果还丰富了现有研究未识别评估的东道国风险因素,如:国土面积、城镇化增长率、城镇化率、人口密度。中国对外承包工程市场投资价值预测模型具备实时性、客观性的市场投资价值预测能力,为中国企业对外承包工程项目可行性研究与投资决策提供科学的依据,提高中国对外承包工程企业的项目风险管理能力。
参考文献(略)