本文是一篇计算机论文范文,本文将知识图谱作为辅助信息,针对用户对知识图谱中实体和关系的细粒度偏好特征学习,以及多元用户间的隐式关联学习,分别优化项目表示建模和用户表示建模。
第1章 绪论
1.1 研究背景及意义
个性化推荐系统(Personalized Recommender Systems)致力于增强各种在线应用程序中的用户体验。传统基于协同过滤(Collaborative Filtering)[1]的算法通过分析用户或项目之间的相似性[2],对用户和目标项目进行匹配进行推荐。然而,随着互联网技术的飞速发展,数据量呈指数级增长以及用户与在线应用交互方式选择的增多,导致传统的推荐算法无法很好地处理数据稀疏和冷启动的问题。因此,很多研究将用户间的社交网络、项目的属性、上下文和项目图像作为侧面信息引入推荐系统中[3],从而提升其性能。网络(图)结构数据通过结点和边建立事物之间的联系,可以更真实地反映现实世界的场景。将知识库中的信息以结构化的形式表示,以图结构的形式展示现实世界中实体的概念及其相互关系,从而形成知识图谱(Knowledge Graph, KG)。知识图谱最初的目的是致力于提升搜索引擎性能,其本质是一个异构图数据表示,实体之间通过不同的关系连接,这使得知识图谱富含语义信息[4][5]。
知识图谱中结点一般是现实世界中具体的实体(如人或物),而边是实体与实体之间所蕴含的关系,结点与边的种类可以是多样的,其展现形式依据构建知识图谱的领域不同而产生不同。例如,在电影知识图谱中,实体与实体之间的关系可以是电影当中的某个属性,如演员、导演、编剧等,并通过这些关系连接电影实体与某位人物实体;而在社交网络中,实体之间的关系可以人与人之间的联系,如朋友、夫妻、同学等。知识图谱本质由大量的实体-关系-实体三元组构成的一个巨大语义信息网络,通过其挖掘用户与项目交互的额外信息,从而缓解推荐系统常见的数据稀疏和冷启动问题[6]。此外,由于可以为推荐的项目与用户的历史交互建立关联,因此可以提高推荐的可解释性[7]。近年来基于知识图谱推荐的研究引起了人们极大的兴趣。
1.2 研究现状
1.2.1 基于知识的推荐系统
知识图谱以网络结构的方式表示大规模的信息数据,其构建方法通常遵循资源描述框架(Resource Description Framework, RDF)[9]的标准。知识图谱通过实体之间的多维密集关联和丰富的语义信息来辅助推荐系统,为改进推荐系统提供了一个新的视角。当前基于知识图谱的推荐方法依据对知识图谱特征的学习过程大致分为如下三类:
(1)基于嵌入的方法直接学习知识图谱中实体和关系的原始结构信息。通常基于翻译距离模型(如TransE[10], TransH[11], TransR[12], TransD[13]等)对知识图谱进行编码,将实体和关系映射为低维嵌入向量作为。KG2E[14]提出一种显示对实体和关系建模的方法,使用高斯分布去表示实体和关系,计算实体与关系之间确定性(知识图谱中三元组的置信程度),学习知识图谱的嵌入表示。同时还有一些研究将知识图谱的嵌入与多种模态的信息结合以丰富项目的表示。CKE[15]将知识图谱的嵌入初始化项目的向量,融合文本、图像等特征信息丰富项目的表示,在一个基础协同过滤模型下预测推荐的分数,进而提升推荐系统的性能。DKN[16]是一个基于知识图谱嵌入并应用于新闻推荐的方法,首先学习新闻标题中实体在知识图谱中的嵌入表示,同时结合新闻中具有文本特征表示以及知识图中实体上下文的信息,然后在一个多通道的学习模型中聚合整个新闻的特征表示,最后应用于推荐系统中计算用户的点击概率,并取得了不错的效果。此外,一些研究在推荐系统中使用其它机器学习的方法与知识图谱的嵌入结合,以获得更好的性能。Huang等人提出的KSR[17]将循环神经网络(RNN)[18]纳入推荐系统,Yang等人提出的KTGAN[19]使用生成对抗网络(GAN)[20]改进知识图谱的嵌入,以提升推荐系统的性能。基于嵌入的方法侧重于学习知识图实体之间的语义关联,而忽略了知识图中信息的连通模式和实体之间的高阶关系,并且缺乏推荐过程的可解释性。
(2)基于路径的方法将知识图谱视为一个异构信息网络,基于知识图谱中元路径或元图构建和提取用户与项目之间的潜在特征。Yu等人提出的Hete-MF[21]基于元路径语义相似度进行推荐,构建项目之间的元路径比计算它们的相似度,优化用户和物品的表示以提升推荐系统的性能。Yu等人提出的PER[22]根据用户的隐式反馈数据构建用户和项目之间的元路径,再结合协同过滤的思想设计用户-实体推荐模型。Luo等人提出的Hete-CF[23]则分别构建了用户与用户、用户与项目、项目于项目的路径来计算其相似度并应用于推荐系统中。Wang等人提出KPRN[24]通过推断路径中存在的顺序依赖关系,对用户进行推荐。基于路径的方法使用知识图谱建立用户与项目之间的路径,通过这些路径连接的相似性以增强推荐。但它们的性能取决于手动设计元路径和元图的结构,这需要大量的先验知识,使得在现实中很难达到最佳性能,并且在处理具有复杂关系的知识图谱时会导致信息丢失。
第2章 相关研究基础
2.2 图论相关概念
2.2.1 图论基础概念
图的定义: 图作为现实生活中常见的非欧数据结构,通常用作表示事物之间存在的关联性。一个图可以表示为一个有序三元组的形式,其定义式如下:
𝐺=(𝑉(𝐺),𝐸(𝐺),𝜑𝐺)(2.1)
其中,𝑉(𝐺)表示一个非空顶点集,𝐸(𝐺)是与𝑉(𝐺)不相交的边集,𝜑𝐺是它们间的关联函数。
路径和圈: 图中的途径(walk)是指一个有限的、交替的顶点和边的序列表示,当途径中的顶点和边都互不相同时被称为路径(path)。图𝐺中的一条路径严格满足如下定义:
(1) 任意顶点和边属于图𝐺;
(2) 任意顶点和边不重复; 依照路径中边的数目定义路径的长度,例如(𝑣1,𝑒1,𝑣2,𝑒2,𝑣3)可以表示为一个长度为二的路径,其中𝑣1,𝑣2,𝑣3表示顶点,𝑒1,𝑒2表示边。
圈(cycle)表示一条封闭的途径,其中只有起点与终点相同,且内部的顶点互不相同。当一个圈中只有一个顶点时称为自环(loop)。
在本文第三章设计的算法KPRLN中,通过建立知识图谱中实体之间的严格路径来学习实体之间的联系,因此在构建的途径中不会出现相同的实体。通过建立严格的路径可以减少深度强化学习状态空间表示的复杂度,从而增加模型的训练效率。
第3章 基于深度强化学习的知识偏好推荐系统 ........................ 18
3.1 引言 ......................... 18
3.2 预备知识 .................................... 20
3.3 模型与方法 ......................... 20
第4章 超图基序优化多元用户表示的推荐系统 ................................ 36
4.1 引言 ................................. 36
4.2 预备知识 ......................... 37
4.3 模型与方法 ...................... 38
第5章 总结与展望 .......................... 52
5.1 总结 .................................... 52
5.2 展望 ................................... 53
第4章 超图基序优化多元用户表示的推荐系统
4.1 引言
在第三章中探讨了用户偏好兴趣对推荐系统的影响,通过建模包含用户细粒度偏好特征的高阶项目表示,从而提升推荐系统的性能。本章从另一个角度即优化用户表示来探讨对推荐系统的帮助。
依照相似的用户间包含彼此的潜在兴趣的原则,通过对用户画像的准确建模,学习用户之间的相似性,从而辅助推荐系统。尤其在面对与项目具有较少交互的冷启动问题时,通过寻找具有相似兴趣的其他用户的交互项目从而完成推荐。一些常用的方法通过显示社交关系可以建立较强的用户关联性,然后在许多推荐场景中无法获得用户间的显示关系。例如在电影或音乐推荐中,用户在注册以及与应用交互的过程中并不一定会展示用户间的社交属性,即便可以建立社交关系也是极其稀疏的。因此,许多研究将隐式关系纳入推荐过程以提升推荐系统的性能。然而,仅仅通过用户间的二元联系建立用户间的隐式关系,将不会包含多元用户交互的可用信息。
许多研究表明,网络中的简单结构包含附加信息[60],这对应于隐式网络中多个用户之间的关联。用户的行为会影响与他们有特定关系的其他人。如图4.1左侧所示,使用u1→u2表示u1认识u2,如果有大量用户指向具有共同交互项目的特定用户u𝑖,那么我们假设u𝑖具有积极影响,因为用户愿意根据u𝑖的行为调整他们的选择。上述“追星现象”只是网络中结构的简单演示,其他结构如图4.1右侧所示。依照用户间存在顺向、逆向、双向和无向四种关联模式,在