优秀电子商务毕业范文篇一
1 绪论
1.1 研究背景与意义
1.1.1 研究背景
为了能从海量数据中挖掘潜在的、有价值的信息,数据挖掘(Data Mining,DM)和知识发现(Knowledge Discovery in Database,KDD)技术[2]应运而生。数据挖掘是从大量的、不全面的、有噪声的、模糊的和随机的数据中,提取出潜在的、有效的、新颖的、有用的和可以理解的信息和知识的过程[3]。根据知识发现的模式不同,数据挖掘过程及其系统主要有以下几类功能:概念/类描述(Concept/Class Description)、关联分析(Correlation and causality)、分类和预测(Classification and prediction)、聚类分析(Cluster analysis)、离群数据分析(Outlieranalysis)和演变分析(Trend and evolution analysis)等[4]。其中,关联分析、分类和预测、聚类分析等数据挖掘模式的研究方向是数据中的主要部分和集中部分的性质或关系,而离群数据分析与挖掘的目的则在于找出隐含在海量数据中相对稀疏而孤立的离群数据模式及其中隐含的知识。离群数据挖掘的应用前景非常广阔[5],如金融、IT、环境、医药、气象等诸多领域,目前已开始融入到数据分析和信息管理技术当中。当今,电子商务以其使用便捷、成本低廉、不受时空限制等优点而逐渐在全球流行起来。电子商务(E-commerce,EC)[6]提供了一种买卖双方进行交流和交易的新方式,但它对传统企业带来了革命性冲击,使传统的交易与管理模式面临严峻挑战:电子商务要求企业管理人员以不同以往的思路来看待网络客户、新型技术工具和未知竞争对手,而仅仅把传统的商业模式以数据处理自动化的形式转换成电子商务是无法取得成功的,只有对管理思维进行革新,使之与电子商务的要求相匹配才能适应新的商业环境。在传统的管理模式中,企业依靠 ERP 系统[7]来提高了生产效率,并实现商业流程的自动化,而在电子商务模式下,互联网中的竞争仅在客户的点击之间,哪些客户经常光顾,关注了什么,哪些产品受欢迎、原因是什么,售前、售后服务存在哪些问题等,这些问题逐渐成为商家关注的焦点。这时,客户关系管理(Customer Relationship Management,CRM)[8]因其能够进行客户资源及相关数据分析而受到重视,但在应用于电子商务时,传统的客户关系管理遇到了无法实现在线互动、难以处理庞大数据等障碍。一方面,互联网信息量巨大,电子商务平台中的商品信息和服务信息繁多,客户难于自主寻找到符合个人需求和爱好的商品信息;另一方面,传统的以展示商品信息为主[ 9 ]的“one-size-fits-all”方法,基本不提供与客户交流的渠道,几乎没有考虑用户的个性需求。因此,电子商务平台的个性化服务由此产生[10],而个性化服务所包含的内容当中,最为重要的一项是为客户提供推荐服务。电子商务推荐服务在帮助客户寻找所需商品、协助完成购买过程的同时,还能够保持与客户的联系,协调、加强客户关系,因而电子商务推荐系统逐渐发展成为电子商务平台的一项重要功能。
1.1.2 研究意义
将数据挖掘技术应用于电子商务及其客户关系管理是必然的发展趋势,这与电子商务和数据挖掘技术的特点是紧密联系的。电子商务作为虚拟化的商业模式,其信息流和资金流均在互联网中完成,仅物流是在线下完成,而在互联网中的交流互动会产生的大量的访问日志、交易记录等数据。对这些数据进行处理和分析能够使商家在一定程度上把握客户的个人偏好和消费习惯,电子商务推荐系统(E-Commerce Recommendation System)就是根据客户的个人偏好和消费习惯来向其推荐商品信息、协助完成购买过程的程序。对于庞大且复杂的电子商务数据,传统的统计分析方法已不足以应对,因而将数据挖掘技术应用于电子商务及其推荐系统既具有必要性,又具有极大的实用价值。离群数据挖掘的目的在于找出隐含在海量数据中相对稀疏而孤立的离群数据模式以及其中隐含的知识,这是离群数据挖掘与关联规则等传统的面向数据主体的数据挖掘的主要区别。本研究拟将离群数据挖掘技术应用于电子商务推荐系统中,其意义可以从理论和实际两方面进行阐述。
(1)理论意义:离群数据挖掘技术的引入将为电子商务推荐系统提供新的研究思路,由于离群数据挖掘技术不同于传统的数据挖掘技术那样以数据的主体部分作为研究对象,而是更注重对较孤立的却独具特征的离群数据的发现和研究,因而能发现一些被传统数据挖掘技术忽略的隐含信息群。
(2)实际意义:离群数据挖掘技术的应用,一方面,将给予客户一些潜在而有用的信息,更全面地为客户提供商品选择支持;另一方面,将给予商家反映一些曾被忽略的经营和销售细节,使其更好地提升服务水平,增加销售收入。以基于用户评分的推荐系统为例,常见的推荐系统往往仅根据多数的或者相似的客户的选择进行推荐,而有可能忽略了一些关注度不高但受到好评且可信程度较高的商品;其次,个别近期的较低评分有可能反映了当期的商品和服务水平发生的变化,而未得到用户的关注和商家的重视,这些都可以通过离群数据挖掘的方法和技术来分析和处理。另外,可以根据离群数据挖掘研究的结果,为现有的电子商务推荐系统增加应用模块。
2 电子商务推荐系统及其技术研究
2.1 电子商务推荐系统的现状分析
对于推荐系统的研究是从上世纪 90 年代中期开始的,各种推荐算法涉及到的研究领域众多,包括信息检索[11]、市场营销建模[12]、管理科学[13]、近似性理论、认知科学等[14]。而推荐系统在电子商务领域的研究具有很重要的现实意义,其应用具有广阔的发展前景。在电子商务的交易平台上,客户的需求通常是模糊的、不明确的,而商户根据客户的偏好将其可能感兴趣的商品推荐出来,就能够将客户的潜在需求转变为实际消费。为此,大型电子商务平台都推出了不同形式的推荐系统,如 Amazon,CDNOW,eBay 等,一些有提供推荐服务要求的网站,如新闻网站、音乐网站、电影网站等,也不同程度地使用了推荐系统,表 2.1 中列举了一些按不同应用领域划分的主流商用推荐系统。目前,已设计出来的电子商务推荐系统模型有很多,如:AVANTI 系统[16]通过对相同用户的访问模式运用自适应规则实现推荐;Site Helper 系统[17]通过对用户访问的网页进行分析,从网页中提取出符合用户兴趣模式的关键词输出给用户,并进一步通过反馈技术向用户推荐其它类似的网页;Footprints 系统[18]在为用户推荐访问量高的网站的同时使用了可视化技术;Web Watcher 系统[19]通过跟踪用户访问网站的路径和浏览行为,来分析其访问规律,进而向用户推荐其可能感兴趣的网页;Schechter 等人[20]设计的系统通过跟踪用户的访问路径来预测其下一步可能的访问页面,并要求代理服务器将相关页面预读取到临时文件存储器中,从而加快用户未来的访问速度;Buchner 等人[21]和Cooleyde 等人对服务器中的访问日志数据运用数据挖掘技术,以分析用户的访问规律,从而实现一定程度上的智能推荐,同时对未来的市场决策有一定指导作用;Nasraouin等人[22]通过聚类分析方法对用户的访问规律进行分析,以达到预测用户兴趣取向和访问方向的目的。伴随着电子商务推荐系统研究的不断深入,越来越多的推荐系统在企业、大学、研究所被开发成型,有些仅作为研究所用,有些已投入商业运营。
3 面向 Web 环境的离群数据挖掘及其技术研究..... 19
3.1 数据挖掘在 Web 环境中的应用...... 19
3.1.1 数据挖掘在 Web 环境中应用的必要性...... 19
3.1.2 Web 挖掘和传统数据挖掘的区别...... 19
3.1.3 Web 挖掘的特点.... 19
3.1.4 Web 挖掘的类型.... 20
3.2 离群数据挖掘及其技术.... 25
3.2.1 离群数据的概念........ 25
3.2.2 离群数据挖掘的技术方法....... 26
3.2.3 离群数据挖掘的研究热点....... 30
3.3 面向 Web 环境的离群数据挖掘...... 33
4 基于离群数据挖掘的电子商务推荐系统设计...... 36
4.1 电子商务推荐系统框架设计...... 36
4.2 基于离群数据挖掘的电子商务推荐模型...... 38
4.2.1 模型建立..... 38
4.2.2 过程设计..... 40
4.2.3 模型补充与优化........ 40
5 实验分析...... 43
5.1 实验设计........ 43
5.1.1 数据来源..... 43
5.1.2 实验环境..... 44
5.1.3 评价标准..... 44
5.3 结果与分析.... 44
结论
本文以电子商务推荐系统及其技术为研究基础,以离群数据挖掘的方法和技术为研究重点,设计和构建了基于离群数据挖掘的电子商务推荐系统框架和基于离群程度模型的推荐算法,并进行了实验设计和分析,主要工作总结如下:
(1)对目前电子商务推荐系统的发展现状、主要理论和技术作了深入细致的研究,详细阐述了电子商务推荐系统的主要作用、技术方法