计算机论文范文栏目提供最新计算机论文范文格式、计算机论文范文硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于Seq2Seq框架的文本风格迁移探讨

日期:2023年03月01日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:308
论文价格:150元/篇 论文编号:lw202302111433088346 论文字数:26855 所属栏目:计算机论文范文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis
器来指导解码器生成质量更高的文本。本文“先重构,后迁移”的训练方法让模型更好地分离内容和风格,从而完成风格迁移任务。

计算机论文参考

第五章总结与展望

文本风格迁移(TST)是一个相对较新的研究领域,旨在保留文本内容的前提下转换文本的风格。虽然目前已出现了一些TST的研究工作,但该领域仍然存在缺乏平行语料、难以对内容-风格解缠、缺乏公认评价指标等问题。针对这些问题,本文开展了以下工作:

1.回顾文本风格迁移、预训练语言模型以及NLP对比学习的研究进展。根据模型的技术路线,将TST模型分为显式TST方法以及隐式TST方法。之后,根据预训练数据的粒度级别,将预训练语言模型划分为预训练词向量模型与预训练编码器模型。最后,概述了常见的对比损失函数,以及NLP中常见的两种对比预训练方法。

2.研究基于预训练语言模型的Seq2Seq风格迁移任务。针对平行语料稀少和非英语TST研究缺失的问题,收集并创建了一个开源的句子级别的“古汉语-现代文”平行语料库,并在此数据集上使用了基于UNILM预训练语言模型的Seq2Seq模型进行训练。实验结果表明,模型在自动评价指标和人工评价指标上都取得了最优的性能。

3.提出基于对比预训练的Seq2Seq文本风格迁移方法。首先,基于数据增强的思想扩充了训练语料,并通过对比学习指导模型区分文本的内容与风格;随后,使用了基于内容-情感对偶编码器的Seq2Seq模型,并结合风格分类器指导文本的风格迁移过程。实验结果表明,ConTraST方法在综合指标上拥有更优秀的性能,并且可以产生更高质量的风格迁移文本。

参考文献(略)