本文是一篇电力论文,本课题通过构建情感模型实现细粒度的情感分析、通过脑电编码模型实现信号冗余信息过滤、以及通过特征工程构建脑电局部变化特点,有效解决脑电情感识别研究中存在的情感识别粒度粗、依赖多通道融合、低频波段识别受限等多个问题。
第1章 绪论
1.1 课题背景及研究意义
情感作为个体对内部或外部事件的反应,涉及到心理状态以及生理情况,是由多种感觉、思想和行为交织产生,其情感本身具有复杂、多样性的特点,对个体的思维方式、决策能力以及身心健康具有不同程度的重要影响意义[1],以情感调节为例,其核心在于个体对情感理解的程度,即个体能细致区分产生的情感类别,同时高度一致的还原表达该情绪,或做出适应反馈的能力。其重要性在于,情感调节能力越高的个体,越能理性分析情感产生的原因,并采取相应措施以及决策行为[2,3],具有较高的抗压能力;而情感失调的个体由于无法理解自身的情感,更容易产生焦虑感、注意力不集中、自我怀疑等消极情绪以及行为[4,5],严重情况会产生心理障碍[6-8]。尤其,根据世界卫生组织(WHO)公布的数据表明,2015年,抑郁症以7.4%位列全球疾病排行第一,占世界人口比例的4.4% [9]。而该数字在收入低、生活压力大、公共设施不完善的国家还在逐年递增[10]。由于心理障碍患者的死亡率是心理健康人群的2.22倍[11],因此,情感识别也作为心理干预手段,帮助个体提升情感调解能力,降低负面情绪带来的心理障碍风险。除了心理健康,情感对生理健康的影响也不容小觑,例如心血管疾病[12]、癌症[13]、阿尔茨海默症[14]、以及帕金森症[15]等。研究表明大量负面情感与疾病产生有密不可分的关系,而积极的正向反馈可加快治疗程度。同时一些突发性公共卫生事件如新冠疫情等也会加重个体情感调节的负担,进一步影响健康状况[16]。因此高效识别并解读情感具有较高的研究意义以及应用价值,例如基于生理信号的情感识别大量用于医疗健康领域,辅助个体提升情感认知能力,进一步实现身心健康的正向循环。
情感心理学中存在两类主流理论用于理解情感,包括:离散情感理论、以及维度情感理论。前者假设情感具有离散性、非连续性,该理论将情感划分为基本情感和次级情感,认为基本情感具有一对一的神经通路,而次级情感则由于基本情感自身、或与内在驱动、认知进行混合构成[17]。尽管关于基本情感的研究并未达成共识,多数研究认为基本情感大致为6至8类[18],常见采用Ekman的经典六类离散基本情感理论,包含:愤怒、厌恶、恐惧、快乐、悲伤以及惊讶[19];而维度情感理论的支持者认为,由于离散情感理论覆盖的情感类别有限,如Ekman理论中,部分情感类别相似,而积极情感的划分过于粗粒度,仅有快乐一类,在情感识别时存在环境难以触发的情况[20],因此,可通过多维度量化指标进行情感识别,即任何情感的构成,可在多维情感空间实现量化评估,不同情感之间平滑过度,消除了离散理论中情感不连续的特点,同时空间距离可表示情感之间的相似或差异程度。
1.2 国内外研究现状
目前,基于脑电的情感识别研究中,主要研究内容及方向包括:(1)情感模型的构建,旨在根据研究目标明确情感识别的类别。(2)脑电通道的选择,旨在进行多通道融合机制的优化,降低冗余通道的依赖,提高单通道、少通道下的情感识别准确率,提高应用价值。(3)脑电特征的选择,旨在通过多维信号特征,如时域、频域、空间等挖掘不同的情感的有效信号特点用于计算分析。
情感模型的构建受不同的情感理论影响,其中SEED[45],MANHOB-HCI[46]等脑电情感数据集采用离散情感模型,即实验过程中,通过预处理给定脑电信号对应的的离散情感标签,如中性、积极和消极,或快乐、悲伤、愤怒等,但由于情感标签数量少、粒度粗,因此无法进行细粒度的情感识别研究;而DEAP[47],DREAMER[48],以及ASCERTAIN[49] 等数据集采用维度情感理论,即在实验过程中对实验者的情感状态进行记录,提供脑电信号对应的情感数据,因此可根据不同的研究需求进行情感模型的构建。例如,Hu等[50]在对DEAP数据集进行处理时,针对日常高频出现的十类离散积极情感[51],通过效价、唤醒度以及兴趣度,构建情感空间的映射模型,并对十种情感进行聚类,分为鼓励、嬉戏、以及和谐三组。实验表明,嬉戏组的情感识别准确率最高,达到90%,而鼓励以及和谐的准确率分别为84%和85%。Liu等[52]在进行脑电情感实验时,首先针对7类离散情感进行情感空间映射模型的构建,并对情感数据进行聚类,给定脑电信号对应的情感标签,实验结果表明,积极情感如快乐、娱乐、以及温柔达到86%的平均识别率,而消极情感如愤怒、厌恶、恐惧以及悲伤的平均识别率仅65%。
脑电通道优化的研究,旨在减少通道的选择,实现低通道的高精度计算准确率,扩大其应用领域。例如,Bos等[53]在进行脑电情感实验时,发现通道F3与F4采集的数据对于情感分析最为可靠。Wu等[54]利用FP1和FP2进行情感识别,实验得到76.34%的准确率。Jalilifard等[55]通过FP1通道记录脑电实验数据,在恐怖和放松电影的刺激下,观察到三种情感状态,即中性、放松和恐惧。通过特征选择,实验达到平均94%的情感识别准确率。Taran等[56]进行脑电情感识别中通道选择的实验,针对FP1,FP2,F3,F4,F7,F8,T3,T4,T5,以及T6设计六组双通道组合进行对照实验,结果表明FP1-F7通道具有更高的召回率。同时在4类离散情感高兴、恐惧、悲伤、放松中,六组双通道组合的整体情感识别准确率为90.63%。Wan等[57]进行了基于脑电信号的重度抑郁症监测实验,结果表明,在重度抑郁症的检测中,通道FP1采集的信号数据更具有分析价值。
第2章 相关理论及技术
2.1 脑电情感实验数据集
脑电情感实验中主要通过刺激物如视觉、听觉、记忆等诱发实验者产生不同的情感状态,一些研究使用图片作为刺激物,如IAPS[68]和CAPS[69],每张图片展示时长为1.5秒-12.5秒。而相关研究[70-73]表明音视频作为刺激源更能有效触发情感。因此,大部分数据集如DEAP、DREAMER、ASCERTAIN、SEED、以及MANHOB-HCI等均采用音视频片段作为刺激源,片段时间持续从35秒到393秒不等。同时,实验通过脑机接口设备进行脑电信号的监控与记录,其中,设备的选择主要为Biosemi Active Two、Emotiv、ESI Neuro- Scan以及OpenBCI,同时由于设备的差异性,采样率也存在非统一的标准,大部分介于128Hz至2048 Hz之间。由于情感理论的非统一性,不同实验采用不同的情感理论对参与者的情感状态进行记录,包括离散情感理论、维度情感理论、以及混合情感理论。
本课题采用DEAP国际标准的公开脑电情感数据集进行分析与研究。该数据集记录了32名参与者,在观看40段不同情感标签的音视频下产生的生理数据,包括脑电信号、眼电信号、以及皮肤电反应信号数据,同时包括每一段音视频刺激后参与者产生自我情感评估,通过四个量化维度,以及1-9的量化区间进行记录,其中包括效价、唤醒度、兴趣度以及优势度。其中实验参与者为32位在校人员,男女比例1:1,年龄区间19至37岁,且身体健康、精神状况良好、无任何精神疾病或脑部损伤、且均日常习惯于右手。
2.2 情感模型
情感是在外界刺激条件下人的复杂的生理物理变化过程,包括3种成分:(1)主观体验,即人对于不同情感的自我感受;(2)外部表现,即人在不同情感时身体各部分动作的量化反应形式;(3)生理唤醒,即由情感的变化引起的生理信号变化[75]。人的情感会受到时间、地理、文化以及个体差异等因素的影响。目前,相关研究主要针对三类情感模型进行研究,包括:
(1)离散情感模型。情感是由多种不同的、离散的基本情感组成的,其余情感由基本情感进行组合得到,人的真实情感包含这些基本情感以及其他复杂情感,离散模型中比较著名的理论是Ekman提出的六类离散情感理论。即根据刺激物的情感标签对用户状态进行直接赋值。如SEED数据集中,脑电情感标签则是根据参与者观看的物料视频情感标签进行赋值,其中包括积极、消极、以及中立三种情感状态;MANHOB-HCI对情感类别进行了细化共9类。其中离散模型对于情感类别的预设,多采用经验法、或根据实验目标进行设定如积极情感心理学的研究、或根据统计法得出高频常见情感。
(2)维度情感模型。情感映射于多个维度组成的坐标系中,其中被广泛使用的是 Russell提出的二维情感空间模型,它将人类的所有情感描述在由效价和唤醒度建立的二维坐标系中。所有情感可以由该二维坐标系中的一个点坐标表示。通过使用维度的方法,人们可以更具体地评估和量化刺激引发的情感反应。即根据多维度情感量化指标要求参与者进行自我评估。常见采用区间划分法。通过对空间进行均等划分,以实现情感数据的标签聚类。以DEAP实验为例,通过对效价-唤醒度的二维空间进行四分类,得到HAHV(高唤醒度-低效价)、LAHV(低唤醒度-高效价)、LALV(低唤醒度-低效价)、HALV(高唤醒度-低效价)四类空间标签,将情感数据的空间分布按照区间划分可实现标签聚类,如图2-2所示。而此类情感模型,标签仍存在粗粒度,且其标签存在理解成本,不便于直接应用。
第3章 基于语义分析的细粒度情感计算模型FGAC .................. 13
3.1 细粒度情感主题挖掘 ............................ 13
3.1.1 数据来源以及预处理 ................... 13
3.1.2 主