(1)通过文献综述和理论分析,明确PPP模式的优缺点以及PPP模式引进和应用的必要性。从对PPP项目成败影响因素、PPP项目合同、不同国家经济发展下PPP项目的发展情况分析以及传统风险分析方法和机器学习在PPP项目的应用这几个方面对国内外研究综述,发现PPP项目的成功与失败不能仅仅归结为单一的因素,而是由多种因素的复杂相互作用决定的,但目前的研究存在一定主观性,研究方法较为传统,未能利用大数据的优势,因此提出基于机器学习的PPP项目合同失败预测研究,借助历史数据挖掘其中的规律来辅助PPP项目的风险识别与决策。
(2)本文通过文献分析,初步识别了三类PPP项目合同失败的影响因素:项目特定因素、机构与法律因素和宏观经济因素。同时从世界银行数据库中收集1990年-2021年的数据,发现数据中存在数据缺失、数据不平衡等问题,本文利用数据分析法对收集到数据进行处理,最终获得38个特征变量。
(3)利用随机森林模型、逻辑回归模型和支持向量机模型分别构建了三种不同的PPP项目合同失败预测模型。通过对这三个模型进行模型性能评估分析发现,机器学习模型在不同的PPP项目所属地区中表现不同。综合AUC和AUPRC的角度来看,在五个发展中国家地区中随机森林模型的表现最优秀,因此采用随机森林算法构建PPP项目合同失败预测模型做进一步分析。
参考文献(略)