(2)模型提升
1.基于信息不对称理论,增加管理层情感分析量化指标为数据集提供了增量信息,提升了模型的分类准确率。本文对比了不包含此类指标和增加该指标LightGBM和AdaBoost模型的分类表现,结果表明,增加该指标后两个模型准确率一致提高,说明增加管理层情感分析指标可以提高模型的分类准确率。
2.异常样本剔除对于分类模型识别财务舞弊是必要的步骤,且对模型性能有提升作用。通过剔除数据集中的异常样本,可以减少模型在训练过程中受到灰色样本的干扰,使模型更集中地学习正常样本的特征和规律,提高模型鲁棒性和提升分类性能。本文使用基于密度的聚类算法DBSCAN检测异常样本,对比剔除异常样本后和初始模型的分类结果,发现模型的准确率提升0.6%,精准度和AUC值也得到提升。说明非舞弊样本中存在异常样本,并且DBSCAN的检测方法是有效的,有助于模型性能的提升。
参考文献(略)