摘要: 目前Internet 上电子商务的规模与其潜力相比是微不足道的,但是电子商务的规模在增加,随着电子商务技术的不断发展和成熟,电子商务网站所积累的数据会越来越多,如何充分利用这些数据资源来为经济发展服务将是今后所面临的一个重要问题。基于以上考虑,数据挖掘技术在电子商务中的应用具有很大的发展前景。
关键词: 数据挖掘;电子商务;信息技术
一、数据挖掘技术的时代背景
进入21 世纪以来,信息技术的高速发展和信息量的飞速膨胀,信息过量几乎成为人人需要面对的问题。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。因此,迫切希望有新一代的技术和工具来对海量数据进行分析,从中及时发现有用的知识,提高信息利用率。
目前,在需要处理大数据量的科研领域中,数据挖掘受到越来越多的关注。我们可以利用数据挖掘技术从海量数据中发现有用信息,帮助商家了解客户以往的需求趋势,并预测未来,从而给商家带来巨大的利润。那么什么是数据挖掘呢?
数据挖掘(Data Mining) 就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。特别要指出的是,数据挖掘技术从一开始就是面向应用的。它不仅是面向特定数据库的简单检索查询调用,而且要对这些数据进行微观乃至宏观的统计、分析、综合和推理,以指导实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测。
二、电子商务简介
作为21 世纪的主要经济增长方式- 电子商务是运用现代计算机通信技术尤其是网络技术来进行的一种社会生产经营形态,根本目的是通过提高企业生产效率、降低经营成本、优化资源配置从而实现社会财富的最大化。那么,什么是电子商务呢? 电子商务是指个人或企业通过Internet 网络,采用数字化电子方式进行商务数据交换和开展商务业务活动。目前国内已有网上商情广告、电子票据交换、网上订购、网上银行、网上支付结算等多种类型的电子商务形式。电子商务正以其成本低廉、方便、快捷、安全、可靠、不受时间和空间的限制等突出优点而逐步在全球流行。
一个电子商务网站每天需要搜集和处理大量的数据,数据的迅速增长与数据分析方法的滞后之间的矛盾越来越突出,人们希望在对已有的大量数据分析的基础上进行科学研究、商业决策或者企业管理,但是目前所拥有的数据分析工具很难对数据进行深层次的处理,使得人们只能望“数”兴叹,数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的,数据挖掘通过在大量数据的基础上对各种学习算法的训练,得到数据对象间的关系模式,这些模式反映了数据的内在特性,是对数据包含信息的更高层次的抽象。
三、数据挖掘技术在电子商务中的应用
在电子商务中,商业信息来自各种渠道,例如,每当我们用信用卡消费时,商业企业就可以在信用卡结算过程收集商业消费信息,记录下我们进行消费的时间、地点、感兴趣的商品或服务,愿意接受的价格水平和支付能力等数据;当我们在申办信用卡、办理汽车驾驶执照、填写商品保修单等其他需要填写表格的场合时,我们的个人信息就存入了相应的业务数据库;企业除了自行收集相关业务信息之外,甚至可以从其他公司或机构购买此类信息为自己所用。
这些来自各种渠道的数据信息被组合,应用超级计算机、并行处理、神经元网络、模型化算法和其他信息处理技术手段进行处理,从中得到商家用于向特定消费群体或个体进行定向营销的决策信息,这种数据信息是如何应用的呢? 举一个简单的例子,当商家通过对业务数据进行挖掘后,发现一个银行账户持有者突然要求申请双人联合账户时,并且确认该消费者是第一次申请联合账户,商家会推断该用户可能要结婚了,它就会向该用户定向推销用于购买房屋,支付子女学费等长期投资义务,商家甚至可能将该信息卖给专营婚庆商品和服务的公司。
假如一个电子商务网站的数据分析员想要知道一些商品出售方面的问题,比如:30 - 40 岁之间的女性对什么产品最感兴趣,她们在购买该产品时,通常还会购买什么其他产品⋯⋯如果只靠以前传统的人工技术,从巨大的商品购买信息中找到答案几乎是不可能的,此时他需要的就是数据挖掘技术。