第六章 全文总结与展望
6.1 全文总结
本文从推荐系统的模型不可知反事实解释入手,研究了基于强化学习和进化算法的反事实解释方法,并实现了一个推荐与解释系统以供主观观测。综合论文主要研究工作总结如下:
1.提出了一种基于强化学习的推荐系统模型不可知反事实解释模型RMAC。RMAC的特点在于,对强化学习基本元素进行了分析设计,实现智能体在优化目标时学习反事实解释搜索策略。并且设计网络结构与动作机制,对于状态,其包含了多个长度不定的列表,方法使用多头注意力机制进行信息提取。对于动作,实际可取的动作数量、类型受输入状态影响而可变,方法将离散的实际动作空间嵌入到连续的原型动作空间,实现网络输出原型动作到实际动作的映射。
2.提出了一种基于多目标进化算法的推荐系统模型不可知反事实解释算法MECER。MECER采用多模式的交叉与变异操作,在非支配解集模式和可行解集模式这两种模式中都具有各自的变量重要性与候选变量集,在进化过程中进行更新。变量重要性和候选变量集都会在子代产生过程中进行指导。选择算子引入单目标适应度函数与多目标帕累托解,实现筛选较优解和保存潜在可行解。通过这些机制,实现减少问题决策空间的效果。
3.设计并实现了一个反事实解释电影推荐系统。管理员可以对系统中的数据进行管理。用户可以在系统中查看推荐的电影,并得到推荐的理由,还可以查看所有电影与进行个人信息管理。在用户的历史记录中,用户可以通过控制历史记录的方式来控制推荐项目。通过这种方法,用户等同于可以修改过去的行为,删除作为推荐理由的交互记录,就能使推荐项目更改为反事实解释中提到的在无该理由情况下会推荐的电影,达到对推荐项目的控制效果。由此可以提高用户的满意度,增加推荐系统的透明度,促进用户信任。为更好理解前面章节提出的相关概念与方法起到了帮助作用。
参考文献(略)