工程硕士论文栏目提供最新工程硕士论文格式、工程硕士论文硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于预训练语言模型的理性情感人机谈判

日期:2023年09月22日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:284
论文价格:150元/篇 论文编号:lw202309211910168600 论文字数:36566 所属栏目:工程硕士论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇工程硕士论文,本文综述了不同层次(文档、句子和方面)上如何应用多种预训练语言模型进行情感分析。其中,文档级情感分析是对整篇文章或文档的情感进行分析,而句子级情感分析则是对单个句子的情感进行分析。

第1章绪论

1.1研究现状

1.1.1心理和情绪因素对人机谈判

工程硕士论文怎么写

随着电子商务的发展,人工协商已经不能满足人们的需求。为此,电子商务中越来越需要引入人机协商技术。然而,由于人机谈判的一方是人,因此需要考虑人的心理和情绪因素对谈判的影响[1]。研究人员综述研究发现,情绪确实会对人机谈判产生影响。2016年,Kim[2]运用磁共振成像扫描技术证明,人类大脑的情感相关区域在与自动化谈判系统进行人机谈判时,针对三种类型的提议表现出不同的活动模式。此外,Kim等人在2017年的研究中[3]发现,在与人或计算机系统进行谈判时,人类的行为存在差异。因此,在自动化谈判系统中如何处理这些差异成为一个值得深入研究的问题。

根据2019年Lee等人的研究结果[4],当人类与具备高认知和情感能力的自动化谈判系统进行谈判时,可以获得更高的收益,而当人类与具备较低认知和情感能力的自动化谈判系统进行谈判时,则获得的收益较少。然而,这并不意味着自动化谈判系统就是不好的,因为如果人类获得了收益,他们很可能会成为回头客[5],从而在长期内产生更多的利润。

Chawla等人[6]在2023年的研究中探讨了情绪在预测人机谈判中两个重要主观目标——谈判结果和合作伙伴看法的满意度中的作用。为了测量和比较谈判对话中不同程度的情绪表达,他们设计了几种方法,包括表情符号、语言和上下文变量。他们经过广泛的基于聊天的谈判数据集分析,发现情绪比人口统计数据和性格特征更能显着影响人们对谈判结果和感知的满意度。特别是,时间分析表明,来自谈判早期和后期阶段的情绪信息主要促成了这种影响。因此,为了更好地捕捉情绪,谈判代理人需要一个持续的学习模型。最后,研究扩展到另一个数据集,结果表明研究发现在更复杂的场景中仍然有效。他们的结果证实,为人机谈判设计情绪感知代理是十分必要的。

1.2本文动机

尽管许多研究人员认为谈判者的感受对谈判结果有重要影响,但现有的人机谈判研究很少涉及到人类谈判者的感受。因此,本文借鉴了谈判心理学[22]、协议技术[23]以及情感分析[24,25]等领域的研究成果,提出了一个基于预训练语言模型ERNIE[26]的人机谈判系统。该系统能够动态识别人类谈判者用自然语言表达的情绪,并对人类情绪和提议做出回应。使用预训练语言模型ERNIE 3.0对情感进行分析,可以更好地理解人类表达的情感,并做出更准确的回应。

尽管预训练语言模型对自然语言处理任务至关重要,但目前并没有太多的综述研究能帮助研究人员从不同角度快速了解各种预训练语言模型,并确定适用于他们特定NLP项目的合适模型。为了弥补这一不足,本文对预训练语言模型进行了综述。通过对Google学术搜索的分析,我们发现了两篇关于预训练语言模型的综述研究,但它们与本文的研究方向略有不同。其中一篇是由Li等人[13]提供的,他们研究了一般任务定义、用于文本生成的预训练语言模型的主流架构、使用现有预训练语言模型来对不同输入数据建模并满足生成文本中的独特属性,以及几种关键的文本生成微调策略。然而,他们并未逐一讨论主流预训练语言模型,而是对预训练语言模型的发展趋势进行了总体探讨。我们发现的第二篇综述是由Qiu等人[15]在2020年提供的,他们对预训练语言模型进行了全面回顾,特别是对各种预训练语言模型进行了分类。但由于该综述发表于2020年3月,没有涵盖之后发布的预训练语言模型,尤其是2020年和2021年发布的中国预训练语言模型。因此,本文将重点关注最近两年的发展,特别是中国预训练语言模型的进展情况。

第2章文献综述

2.1预训练语言模型的发展

本节主要涵盖了以下六点工作。第一,我们简要介绍预训练语言模型使用的主要机器学习方法。第二,我们探索早期的预训练语言模型并讨论主要的最先进的预训练语言模型。第三,我们回顾了几种中文预训练语言模型。第四,我们比较了主流预训练语言模型的性能。第五,我们概述了预训练语言模型的应用。最后,我们对预训练语言模型的未来发展进行了展望。

2.1.1所基于的机器学习方法

(1)长短期记忆网络

循环神经网络(Recurrent Neural Network,RNN)[28]通常用于处理诸如机器翻译和情感分析等序列数据,但它们是短时记忆网络。当面对足够长的数据序列时,由于RNNs可能在反向传播过程中遇到梯度消失问题,难以将较早的信息传递到后面的处理中。长短期记忆网络(Long Short-Term Memory,LSTM)[29]是一种改进的RNN模型。在RNN的基础上,增加了输入门、遗忘门和输出门以控制和保留信息,从而克服了短时记忆的局限性。遗忘门控制上一时刻的单元状态有多少能保留到当前时刻。输入门决定了多少即时状态可以输入到单元状态中。最后,输出门负责控制有多少单元状态可以作为LSTM的当前输出值。然而,在RNN和LSTM中,当面对长序列时,输入词向量所携带的大部分信息可能会丢失,从而影响模型在长序列上的表现。

(2)注意力机制

注意力机制(Attention Mechanism,AM)[30]是一种常用于自然语言处理任务的技术,它允许模型更加关注输入序列中与当前任务相关的部分。在编码器-解码器结构中,AM可以为编码器中的所有隐藏状态设置权重,并将加权求和后的隐藏状态信息输入到解码器层。AM的使用可以提高模型的性能和效率。当RNNs与注意力机制结合时,它们可以预测输出序列的特定部分,并将注意力集中在输入序列的特定部分,以生成更高质量的输出。因此,Yu等人[31]将LSTM与注意力机制和双向LSTM集成在一起,用于中文问答系统,解决了中文问答数据集中由于中文语法、语义和词汇限制造成的困难。AM+LSTM模型保留了LSTM编码器在输入序列上的中间输出,并在此基础上使用注意力机制,使得模型更加关注输入序列中与当前任务相关的部分,并将输出序列与模型输出关联起来,从而提高了模型的性能。

2.2预训练语言模型在情感分析中的应用

在本节中,我们首先回顾了不同层次情感分析的四个核心任务以及预训练语言模型在不同层次情感分析中的应用。其次,我们研究了预训练语言模型在跨语言情感分析中的基本应用。最后,我们讨论了使用预训练语言模型进行情感分析的挑战和未来的研究方向。

2.2.1单语言情感分析

表2.3总结了情感分析的三个主要级别:方面级别情感分析、句子级别情感分析和文档级别情感分析[76]。本节简要描述了不同级别情感分析的任务以及预训练语言模型在每个级别的应用。

(1)文档级情感分析

文档级情感分析将整个文档作为一个对象,确定整个文档是否表达了积极或消极的情感或观点[77]。文档级情感分析就像人一样做出总体判断,它需要综合考虑整个文本的情感倾向。这种级别的分析对于理解文本的整体情感非常重要,尤其是在处理长文本、新闻报道、社交媒体帖子等时。在这种情况下,观点持有者可能对实体持有积极的态度,但对许多方面持有消极的态度[78,79]。例如,在电影评论中关于主角的评论:‘‘他不是一个善良的人,他只是为了赚钱而这样做。但是他确实拯救了许多无法负担昂贵药物的穷人的生命。”尽管前两个句子是消极的,但考虑到最后一个句子,我们可以很容易地理解评论者总体上对主角持有积极的态度。文档级情感分析就像人一样做出总体判断。因此,文档级情感分析需要考虑单词和句子之间的语义关系以及单词和句子的整体上下文。

对于长文本的文档级情感分析,提取文本中多个实体之间的关系是必要的。确切的实体可能以不同的形式出现在文本中多次。为了解决这个问题,Han等人[80]提出了一种基于BERT的one-pass模型,可以在处理文本时更好地预测实体之间的关系。在DocRED数据集上,他们的模型相比于不使用任何预训练语言模型的最先进模型,实现了6%的F1值提升。

第3章系统结构及原理························21

3.1模型定义.......................21

3.2系统结构...................22

3.3对话理解..........................23

第4章谈判策略························37

4.1情绪安抚策略.....................37

4.1.1共情策略.....................37

4.1.2示弱策略.....................38

第5章实验分析··························46

5.1分类模型评估指标..........................46

5.2意图和情感识别表现..............................46

5.3谈判成功率....................................47

第5章实验分析

5.1分类模型评估指标

在本文中,我们采用混淆矩阵来衡量模型在不同类别上的预测准确性。在混淆矩阵中,真正类别(TruePositive,TP)是指模型将正类别样本正确地预测为正类别的数量。真负类别(True Negative,TN)是指模型将负类别样本正确地预测为负类别的数量。假正类别(False Positive,FP)是指模型将负类别样本错误地预测为正类别的数量。假负类别(False Negative,FN)是指模型将正类别样本错误地预测为负类别的数量。基于混淆矩阵,我们可以计算以下评估指标:

工程硕士论文参考

准确率是模型预测正确的样本数量与总样本数量的比例,精确率用于衡量模型在