在职研究生论文栏目提供最新在职研究生论文格式、在职研究生论文硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于游记的旅游意图的挖掘方法

日期:2022年03月19日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:622
论文价格:100元/篇 论文编号:lw202203051518556268 论文字数:36566 所属栏目:在职研究生论文
论文地区:中国 论文语种:中文 论文用途:在职研究生论文 On-the-job graduate paper
文本,其中存在标点的不规范使用,中英文符号混用等问题,需要进行数据预处理,方便后续长句的划分。预先将标点进行规范化,将英文符号统一成中文符号,文本中的括号、书名号、扩折号等符号用逗号来替代,方便后续处理。

(2) 长句切分

游记中以长句居多,为了方便后续的特征提取或者分词工作,需要将长句切分。将标点符号集<?!。;….,>作为分隔符,把一个长句切分成多个子句。

6 结论与展

6.1 本文工作与贡献

本文旨在提出一种旅游意图的挖掘方法,能从游记中挖掘有效信息,并预测游客的内在需求和旅游意图。传统的游客行为模型研究粒度较粗,集中在游客的旅游景点层面。然而即使前往相同景点,游客的游玩活动,情感还是存在区别,因此本文提出细粒度的挖掘游客旅游行为的方法,细化到游客在旅游景点的活动,对活动的情感表达等。

第一,提出了游客行为模型的构建方法。本文基于游客的活动和情感信息构建游客行为模型,并以事理图谱作为知识表示方式,动态展示游客的旅游活动和情感变化。基于词典匹配的方法从游记中抽取旅游目的地。

在抽取游记中旅游活动和情感词时,传统的词对抽取的方法效果不佳。因此本文结合游记的特点,提出了基于词性规则和依存关系抽取的方法。该方法通过实验验证,相比单纯使用词性规则模版,抽取到的结果更全面。与传统的最近距离法和 SBV 极性传递法相比,F1 值高出 20.75%,31.8%。之后将抽取的词对进行筛选匹配,结合事理图谱的动态演化特点,表示游客的行为模型,动态反映其变化过程。

第二,提出了旅游意图预测模型的构建方法。由于目前旅游领域缺少统一的旅游意图类别体系,本文需要构建一个类别体系。通过主题模型和文献研究相结合的方法,定义了 8 项旅游意图类别,将其作为预测模型的标签集。旅游行为模型的事理图谱结合了活动、情感、结构特征,将作为预测模型的输入。为了将图谱进行量化输入,提出了表示行为模型图谱特征的三通道向量矩阵。构建活动词向量、情感词向量和上下文词向量,分别对应图谱的活动、情感、结构特征,并将三者在空间层面叠加,形成三维特征词向量矩阵。构建旅游意图预测模型时,基于 TextCNN 模型,在输入层、池化层、输出层等进行改进,最终输出概率向量,实现预测。通过人工标注数据集进行实验,效果优于传统的 TextCNN 和 ML-KNN模型,F1 值提高了 12.1%和 6.2%,Hamming-loss 下降了 0.1203 和 0.0975,证明该方法效果应用于旅游意图预测时效果较好。

参考文献(略)