第五章总结与展望
文本风格迁移(TST)是一个相对较新的研究领域,旨在保留文本内容的前提下转换文本的风格。虽然目前已出现了一些TST的研究工作,但该领域仍然存在缺乏平行语料、难以对内容-风格解缠、缺乏公认评价指标等问题。针对这些问题,本文开展了以下工作:
1.回顾文本风格迁移、预训练语言模型以及NLP对比学习的研究进展。根据模型的技术路线,将TST模型分为显式TST方法以及隐式TST方法。之后,根据预训练数据的粒度级别,将预训练语言模型划分为预训练词向量模型与预训练编码器模型。最后,概述了常见的对比损失函数,以及NLP中常见的两种对比预训练方法。
2.研究基于预训练语言模型的Seq2Seq风格迁移任务。针对平行语料稀少和非英语TST研究缺失的问题,收集并创建了一个开源的句子级别的“古汉语-现代文”平行语料库,并在此数据集上使用了基于UNILM预训练语言模型的Seq2Seq模型进行训练。实验结果表明,模型在自动评价指标和人工评价指标上都取得了最优的性能。
3.提出基于对比预训练的Seq2Seq文本风格迁移方法。首先,基于数据增强的思想扩充了训练语料,并通过对比学习指导模型区分文本的内容与风格;随后,使用了基于内容-情感对偶编码器的Seq2Seq模型,并结合风格分类器指导文本的风格迁移过程。实验结果表明,ConTraST方法在综合指标上拥有更优秀的性能,并且可以产生更高质量的风格迁移文本。
参考文献(略)