电子商务论文栏目提供最新电子商务论文格式、电子商务硕士论文范文。详情咨询QQ:1847080343(论文辅导)

大数据视角下基于文本挖掘的电商问答系统持续使用意向电子商务研究

日期:2020年06月01日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:1389
论文价格:150元/篇 论文编号:lw202005271029568172 论文字数:41588 所属栏目:电子商务论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇电子商务论文,本文爬取京东自营笔记本电脑的问答系统的全部数据,通过文本分类和聚类的技术,挖掘问答系统信息内容的特征,确定问答系统所提供的信息服务类别。为了进一步确认这些信息内容所具备的独特属性,同时爬取相同产品的在线评论数据进行聚类后与问答系统的挖掘结果作对比,得出两者的异同点和关联性,进而分析总结出问答系统信息内容的属性,即影响电商问答系统持续使用意向的因素。最后本研究以 ECM-IT 为初始模型,根据大数据分析的方法挖掘出来的电商问答系统持续使用意向影响因素,结合前人研究和深度访谈结果,构建了电商问答系统持续使用意向模型,进而对电商问答系统持续使用意向开展深入研究。


第 1 章  绪论


1.1 研究背景与意义

在过去的十年里,互联网技术极大地改变了人们的生活方式。尤其在网上购物方面,这种既新颖又方便的购物方式越来越受欢迎,并且在目前消费者日常生活中所占的比例不断提高。中国互联网络信息中心(CNNIC)发布的信息表明,我国线上购物人数在2018 年底突破了 6 亿人,相比 2017 年增长了 14.4% [1]。中商产业研究院大数据库显示,从 2011 年开始网络购物用户规模快速增长,截止 2018 年又有 4.2 亿人加入网购大军[2]。且 2018 年中国网络购物市场交易规模达 7.6 万亿元,较去年增长 24.2%,其中我国最大的 C2C 网站淘宝网的销售额超过了 3650 亿美元,而美国亚马逊的销售额也达到 1780亿美元。最近的统计数据也显示,消费者对电子商务的热情比以往任何时候都要高。据预测,2019 年全球超过 60%的互联网用户将在网上购买产品。

近年来,网上购物己经成为人们平时购物的主要选择。但是海量的商品中存在着很多的劣质商品,消费者经常买到与商家描述不符的商品,这导致电商平台和商家逐渐失去消费者的信任,这种消费者对商家提供的信息不信任的问题在很大程度上阻碍了电商的发展[3] [4]。许多学者对于这一问题进行了研究,提出了几种解决方式,最主要的一种方式是在线评论。消费者在网上购物后,会发表对本次购物过程以及商品使用的体会。消费者在购物前,便能够通过浏览其他购买者的评论获取自己对于该商品不确定的信息。由于当前越来越多的人选择线上购物,在线评论的数量爆发式地增长[5]。一方面,它让消费者在购物时可以有更多的参考。另一方面,在线评论数量的激增也意味着信息超载,这可能导致消费者耗费大量的精力浏览海量的评论,并且这些评论的观点可能不一致,用户很难辨别其真伪[6] [7]。甚至还会出现“刷好评、恶意差评”的现象,因此消费者对于评论信息的信任程度会逐渐降低。

图 1-1  京东问答模块

...........................


1.2 国内外研究现状

1.2.1 电商平台问答系统的研究现状

电商平台问答系统是一种新型的在线问答社区形式。在线问答社区利用社区智慧,通过提问和回答问题进行知识交流[10]。它起源于传统的在线问答服务,主要依赖于从现有的知识库、各种网站或雇佣的专家那里提取信息。关于在线问答社区的研究已有很多,Bickart 和 Schindler 通过实验证明在线论坛是消费者信息的重要来源,这为该领域的研究提供了一个早期基础[11]。此外,在金融领域,用户生成的内容已被证明对股票表现有显著影响[12]。

考虑到在线问答社区的诸多优势,电商网站也借鉴了它们的做法,推出了类似的产品,比如京东的问答系统。该系统具有双向交互、信息内容详细且可靠、易于获取需求信息等特征,并且只有消费者在网上购物犹豫不决、想要进一步了解商品信息、对于商家和在线评论提供的信息产生疑惑时才会使用该问答系统。问答系统的相关研究主要涉及到答案质量和行为研究。答案质量已经引起了研究人员的注意,为了轻松地从数据库中检索到先前回答的问题,他们试图区分高质量的答案与低质量的答案[13]。答案质量的事务级别是不同的,不同网站提供问题的答案是处于不同质量水平的[14]。这一领域的研究主要由信息检索领域的问题和理论驱动。目前,网络问答社区的行为研究主要集中在消费者的知识贡献行为上。研究人员主要试图解释知识贡献的数量方面,但知识贡献的质量方面却被忽视。例如,Nam 等总结了关于用户参与在线问答社区的答案数量的用户参与模式和动机[15]。Yu 等研究了用户激励声誉系统等社会技术机制对知识贡献量的影响[16]。Jin 和 Lee 运用期望确认理论研究了这类社区用户回答问题的持续意愿,重点关注知识贡献频率,即数量方面。

................................


第 2 章  相关理论与技术研究


2.1 信息系统持续使用模型

Bhattacherjee 提出了信息系统持续使用模型(ECM-IT),认为最初的接受只是实现信息系统成功的第一步,这最终取决于信息系统的继续使用,而不是其最初的接受程度,模型结构如图 2-1 所示[62]。这个模型认为用户继续使用的意愿直接受到他们对未来使用信息系统的预期收益的感知,以及基于他们之前使用经验的满意度的影响。反过来,用户在使用前对使用该技术的好处的预期得到确认,从而直接影响感知有用性和满意度。从概念上讲,ECM-IT 依赖于这样一个前提:经验反应(确认)、利益预期(感知有用性)和情感反应(满意度)塑造了用户继续使用信息系统的决定。在这一点上值得注意的是,确认先前的期望是 ECM-IT 与其他解释信息系统使用行为(如 TAM、TPB 及它们的扩展)的模型的主要区别。

图 2-1  信息系统持续使用模型(ECM-IT)

...........................


2.2 电商问答数据获取方法

本文基于 Requests 功能库进行问答系统数据的爬取[68]。目前对于网页的爬虫主要是通过 Requests 功能库或者 Scrapy 框架,本研究使用 Requests 功能库而不是 Scrapy 框架是对比两种方法的优缺点后选择的。Request 功能库与 Scrapy 框架相比,它们的共同点在于两者都可以进行页面请求和爬取,是 Python 爬虫的两个重要技术路线;两者都具有很好的可用性,文档丰富;两者都没有提交表单、对应验证码等功能。对于两者的不同点,首先 Requests 是页面级的爬虫,而 Scrapy 是网站级的爬虫;其次 Scrapy 的并发性和性能都要好于 Requests;最后 Request 重点在于页面下载,而 Scrapy 重点在于爬虫结构。由于本论文只爬取问答系统的提问文本,爬虫需求较小,属于页面级爬虫,因此采用 Requests 功能库进行数据爬取。具体的数据爬取流程图如下。

图 2-2  数据爬取流程图

.............................


第 3 章  基于文本挖掘的电商问答系统信息内容特征提取 ______________ 18

3.1 问题描述 ______________________  18

3.2 实验数据集 __________________  18

第 4 章  基于信息内容特征对比的问答系统持续使用意向影响因素分析 ____________ 35

4.1 问题描述 ________________  35

4.2 实验设计 __________________  35

第 5 章  基于 ECM-IT 的电商问答系统持续使用意向研究 __________________ 41

5.1 问题描述 __________________  41

5.2 理论模型的构建 ____________________  41


第 5 章  基于 ECM-IT 的电商问答系统持续使用意向研究


5.1 问题描述

虽然目前关于问答系统持续使用意向的研究很多,但大多聚焦于社会化问答系统的研究,缺乏对于电商问答系统的持续使用意向的研究。由于电商问答系统是建立在电商平台上的,其系统特征、使用对象和使用场景都不同于一般社会化问答系统。研究电商问答系统用户持续使用意向对商家、平台和消费者都具有重要意义。由于在研究前无法得知哪些因素影响了电商问答系统的持续使用意向,如果只是参照其他学者对于社会化问答系统持续使用意向的研究,以及深度访谈的结果,得出的影响因素是不全面的。因此本文通过文本挖掘的方法确定问答系统为消费者提供的信息服务类别,进一步分析出问答系统信息内容的属性,进而找出影响电商问答系统用户持续使用意向的具体影响因素。

通过上一章的实验结果我们得知电商问答系统和在线评论不仅是信息互补的关系,且问答系统为在线评论的信息提供了验证。问答系统提供了如商品功能和商品对比等评论中无法提供的信息,消费者在购物时通过使用问答系统可以获得这些信息,感知到了问答系统的内容有用性;对于售后服务、质量、赠品等信息,在评论中是可以获得的,但是消费者一是会在问答系统中再次查证,消费者通过使用问答系统,感知到了问答系统的内容可靠性;二是消费者认为通过电商问答系统获取信息的认知成本更低。那么消费者感知到的内容有用性和可靠性以及认知成本是否显著影响问答系统持续使用的意向呢,本文接下来通过构建扩展的信息系统持续使用意向模型研究消费者对于问答系统的持续使用意向。由于在电商平台中,信息不对称以及评论信息超载现象严重,还应考虑与用户选择和使用电商问答系统有关的因素。因此本研究在 ECM-IT 的框架下,引入了信任等影响因素,研究上述因素与电商问答系统用户持续使用意向的关系。

................................


第 6 章  结论与展望


6.1 主要结论

电商问答系统信息内容的特征是什么?提供了哪些信息服务类别?其信