基于Seq2Seq框架的文本风格迁移探讨 (第2页) - 计算机论文范文

基于Seq2Seq框架的文本风格迁移探讨

日期：2023年03月01日编辑：ad201107111759308692 作者：无忧论文网点击次数：404

论文价格：150元/篇论文编号：lw202302111433088346 论文字数：26855 所属栏目：计算机论文范文

论文地区：中国论文语种：中文论文用途：硕士毕业论文 Master Thesis

器来指导解码器生成质量更高的文本。本文“先重构，后迁移”的训练方法让模型更好地分离内容和风格，从而完成风格迁移任务。

计算机论文参考

第五章总结与展望

文本风格迁移（TST）是一个相对较新的研究领域，旨在保留文本内容的前提下转换文本的风格。虽然目前已出现了一些TST的研究工作，但该领域仍然存在缺乏平行语料、难以对内容-风格解缠、缺乏公认评价指标等问题。针对这些问题，本文开展了以下工作：

1.回顾文本风格迁移、预训练语言模型以及NLP对比学习的研究进展。根据模型的技术路线，将TST模型分为显式TST方法以及隐式TST方法。之后，根据预训练数据的粒度级别，将预训练语言模型划分为预训练词向量模型与预训练编码器模型。最后，概述了常见的对比损失函数，以及NLP中常见的两种对比预训练方法。

2.研究基于预训练语言模型的Seq2Seq风格迁移任务。针对平行语料稀少和非英语TST研究缺失的问题，收集并创建了一个开源的句子级别的“古汉语-现代文”平行语料库，并在此数据集上使用了基于UNILM预训练语言模型的Seq2Seq模型进行训练。实验结果表明，模型在自动评价指标和人工评价指标上都取得了最优的性能。

3.提出基于对比预训练的Seq2Seq文本风格迁移方法。首先，基于数据增强的思想扩充了训练语料，并通过对比学习指导模型区分文本的内容与风格；随后，使用了基于内容-情感对偶编码器的Seq2Seq模型，并结合风格分类器指导文本的风格迁移过程。实验结果表明，ConTraST方法在综合指标上拥有更优秀的性能，并且可以产生更高质量的风格迁移文本。

参考文献（略）