.............................
第五章 总结与展望
5.1工作总结
本文通过相关研究现状发现传统的文本情感分类方法过分依赖情感词典的构建和繁重的特征清洗工程,消耗了大量的人力并且可维护性很低,而基于统计机器学习的方法对其特征学习能力较差,无法准确地识别出一些文本中隐含的情感特征信息。如何准确、有效地挖掘出文本的内部情感以及提升目前现状阶段情感分类的性能是可以让计算机更加理解人类的情感和推动 NLP 领域向前进一步发展的重要一环。针对该问题,本文利用深度学习和集成学习来加强机器文本分析的能力,提出了相应的方案并进行了验证实验,主要完成的详细工作内容如下:
1、针对传统基于统计机器学习模型对口语化严重的评论文本学习建模能力较差的问题,将研究方向延伸至深度学习领域,提出了 DBGRU-MFCNN。该模型不仅在 RNN 部分使用了交替式双向传播迭代模式,并且在 CNN 部分添加了 TF-IDF 和情感注意力的融合特征向量对DBGRU 的语义特征进行补充,同时对文本进行分布式的词向量表示和字向量表示,在池化层中将二者的特征向量进行融合,最终输出情感分类结果。不仅实现了对评论文本的深层次语义特征学习,也实现了对评论文本结合不同情感特征维度的倾向性分类学习。
2、针对如何在集成学习的基础上,进一步提升文本情感分类效果的问题,本文通过大量文献研究发现,其传统机器学习模型对训练数据集的质量有一定的依赖性,因此基于深度学习的两大生成模型框架进行融合后提出了 VAE-ECGAN。通过不断地对抗训练去拟合真实文本的数据分布,并利用 Stacking 算法的集成学习模型来使文本情感分类的性能得到提升。在整个 VAE-ECGAN 训练的过程中,得到了情感文本生成效果较好的生成模型以及情感分类准确率更加优异的集成情感分类模型,为文本情感分类领域研究提供了全新的研究思路。
参考文献(略)