定义 1 兴趣点集合。 令表示一个兴趣点,其中分别表示兴趣点的经纬度,则表示兴趣点中的文本信息,如兴趣点的名称、类别、描述等。兴趣点是根据地点的语义和功能而概括出的精炼表达,如餐厅、电影院、博物馆等。
定义 2 签到记录集合。 用户集合U 内所有用户的签到记录集合为,其中三元组表示某个用户在这个时间点访问了某个位置。用户的签到在很大程度上反映了用户对于某地点的行为模式。
定义 3 用户社会关系图。 令代表用户社会关系网络图,其中U 为用户顶点集合, E 为边集合,用户顶点代表一个用户,边表示用户和具有直接朋友关系。
定义 4 用户居住位置。 用户位置一般不仅仅局限于家庭住址,有可能是学校或公司等,并且用户u 的居住位置的数据一般来说很难直接获取,因此本文使用文献[50]中提出的方法,将用户签到次数最多的兴趣点位置视为用户的居住位置,基于此以用户的位置为核心点进行聚类。
第 5 章 结论与展望
5.1 结论
伴随着网络技术和智能手机的发展,兴趣点的推荐目前依然是 LBSN 领域的热点之一。目前,对于 POI 推荐的研究与分析,大多数停留在单个 POI 推荐,推荐方法也停留在融合不同的 POI 因素进行计算,例如时间因素、POI 类别因素、地理距离因素等,推荐效果不是非常理想。此外,对于 POI 路径推荐的研究方法,大多集中在旅游路线的规划上。针对现阶段存在的研究问题,本文对 POI路径推荐进行了改进与优化,结合神经网络算法,在 POI 推荐的的研究背景下提出了一种新的研究方法,用于完成 POI 路径推荐。便于一些位置服务提供商,诸如美团、携程等可以更好的为用户提供 POI 推荐服务,为用户的下一步出行提供选择。
本文的主要工作内容是提出一种基于上下文信息的 POI 路径推荐的分析方法。该方法方法包含两部分,分别为 POI 数据的扩展过程,以及 POI 路径的生成过程。
在第一部分的过程中,本文提出的基于上下文信息的 POI 数据的扩展过程,对用户缺失的一些 POI 签到数据进行预测,能够提高 POI 推荐的准确性。该方法使用 Seq2seq 方法,输入用户在进行一天的 POI 访问的签到序列,根据用户访问记录,在输出结果中,将缺失的签到记录进行补全预测。在“编码器 Encoder”部分中,对用户一天中的 POI 访问序列信息进行编码为文本信息并输入,一方面使用BiG RU 来获取当前需要预测的节点的邻近信息,另一方面使用多头注意力机制来获取当前输入的全局信息,并分别加持局部和全局注意力机制,来获得用户短期和长期的偏好。在“解码器 Decoder”部分中,使用两阶段的解码器,将局域信息与全局信息进行综合训练,最终得出最后的预测结果,更好的得到用户的访问偏好。最后经过实验结果证明,本文提出的 POI 签到数据的扩展的过程,能够很大程度上丰富现有的稀疏的 POI 数据集,提高 POI 推荐的准确性。
在进行 POI 数据稀疏性解决后的基础上,本文提出了一种融合社交关系和地理信息的 POI 路径的生成过程,用来向用户推荐 POI 的路径规划,用于用户在进行 POI 访问和行程规划时,提供路径选择。在数据处理时,使用融合流行度因素的 DBSCAN 算法来推荐用户最常访问的区域范围,将噪声点中一些流行度较高的 POI 加入最近的聚类簇中,从而更加全面的考虑到了用户的个性化偏好。并通过考虑用户的社交关系,计算出社交关系值,考虑用户的独特偏好,以及使用幂律分布函数的思想计算地理距离对用户访问 POI 的影响,计算出Top-N 核心点的集合,再通过集合中的核心点使用基于有效覆盖的 FP-growth 算法,最终计算出前 Path-N 条推荐路径列表。经过实验结果验证,本文所提的出的 POI 路径推荐的方法,能够进一步提升 POI 推荐的准确率,在 POI 路径推荐方面,通过实验对比,本文的推荐方法也较其他方法有所提高。
参考文献(略)