当前位置:论文网 > 论文宝库 > 经济管理论文 > 电子商务论文 > 正文

研究电子商务中数据挖掘技术的应用

来源:UC论文网2015-12-02 17:35

摘要:

关键词:电子商务,数据挖掘,聚类分析,关联规则挖掘 1引言 随着Internet的普及,电子商务得到了前所未有的发展,经销商和客户之间通过互联网进行交易,节省了大量的费用和时间。但

关键词:电子商务,数据挖掘,聚类分析,关联规则挖掘
  1引言
  随着Internet的普及,电子商务得到了前所未有的发展,经销商和客户之间通过互联网进行交易,节省了大量的费用和时间。但是在电子商务中充斥着大量的数据,如何从这些大量的数据中挖掘出真正有价值的信息,帮助企业经销商制定更好的营销策略是电子商务急需解决的问题。数据挖掘,又称数据库中的知识发现(Knowledge Discovery in Database, KDD),也就是从大量的数据中挖掘出有用信息的一种技术。利用数据挖掘技术可以使经销商从大量的数据中挖掘出有用的信息帮助决策,从而在市场竞争中获得优势地位。
  2电子商务概述
  电子商务指交易当事人或参与人利用现代信息技术和计算机网络(主要是因特网)所进行的各类商业活动,包括货物贸易、服务贸易和知识产权贸易。“电子商务”中所包括的“现代信息技术”应涵盖各种使用电子技术为基础的通信方式;“商务”指不论是契约型还是非契约型的一切商务性质的关系所引起的种种事项。如果将“现代信息技术”看作一个子集,“商务”看作另一个子集,电子商务所涵盖的范围应当是这两个子集所形成的交集,即“电子商务”标题之下可能广泛涉及的因特网、内部网和电子数据交换在贸易方面的各种用途。
  电子商务与传统商务相比有以下优点:(1)电子商务将传统的商务流程数字化、电子化,让传统的商务流程转化为电子流、信息流,突破了时间空间的局限,大大提高了商业运作的效率。(2)电子商务简化了企业与企业,企业与个人之间的流通环节,最大限度地降低了流通成本,能有效地提高企业在现代商业活动中的竞争力。(3)电子商务是基于互联网的一种商务活动,互联网本身具有开放性全球性特点,电子商务可为企业及个人提供丰富的信息资源,为企业创造更多商业机会。(4)电子商务对大型企业和中小企业都有利,因为大中型企业需要买卖交易活动多,实现电子商务能有效地进行管理和提高效率,对小企业同样有利,因为电子商务可以使企业以相近的成本进行网上交易,这样使中小企业可能拥有和大企业一样的流通渠道和信息资源,极大提高了中小企业的竞争力。(5)电子商务将大部分商务活动搬到网上进行,企业可以实行无纸化办公节省了开支。
  3数据挖掘技术
  数据挖掘(Data Mining,DM)技术是随着计算机的广泛应用和数据的大量积累而发展起来的。数据挖掘是从大量的数据中提取或“挖掘”知识,即发现其中隐含的,未知的,有意义的信息的过程,它又被称为“数据库中知识发现”(KDD),也有人把数据挖掘视为数据库中知识发现的一个基本步骤,知识发现过程由以下步骤组成:(1)数据清理(2)数据集成(3)数据选择(4)数据变换(5)数据挖掘(6)模式评估(7)知识表示。
  从商业的角度定义,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。利用功能强大的数据挖掘技术,可以使企业把数据转化为有用的信息帮助决策,从而在市场竞争中获得优势地位。数据挖掘与传统的数据分析的不同是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和实用3个特征。
  4数据挖掘在电子商务中的作用
  数据挖掘技术之所以可以服务于电子商务,是因为它能够挖掘出活动过程中的潜在信息以指导电子商务活动。在电子商务中的作用有7个方面:(1)挖掘客户活动顾虑,针对性的在电子商务平台下提供“个性化”的服务。(2)可以在浏览电子商务网站的访问者中挖掘出潜在的客户。(3)通过电子商务访问者的活动信息的挖掘,可以更加深入的了解客户需求。(4)通过挖掘网上顾客的购买行为,可以帮助制定合理的产品策略和定价策略。(5)通过对商品访问情况和销售情况进行挖掘,可以帮助制定产品营销策略,优化促销活动。(6)优化电子商务网站的信息导航,方便客户浏览。(7)通过客户在网络上浏览时的拥塞记录发现网站的性能瓶颈,从而提高网站的稳定性,保证电子商务购物快速进行。
  5电子商务中数据挖掘的技术与方法
  电子商务中的数据挖掘过程一般包括3个主要的阶段:数据准备、数据挖掘、结果解释和评价。(1)数据准备又可分为数据选取和数据预处理两个步骤。数据选取的目的是确定发现任务的操作对象。即目标数据,是根据用户的需要从原始数据库中抽取的一组数据。数据预处理一般包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换以及对数据降维。(2)数据挖掘阶段首先要确定数据挖掘的目标和挖掘的知识类型。确定挖掘任务后,根据挖掘的知识类型选择合适的挖掘算法,最后实施数据挖掘操作,运用选定的挖掘算法从数据库中抽取所需的知识。(3)结果的解释和评价。数据挖掘阶段发现的知识,经过评估,可能存在冗余或无关的知识,这时需要将其剔除,也有可能知识不满足用户的需求,需要重复上述挖掘过程重新进行挖掘。另外,由于数据挖掘最终要面临用户,因此,还需要对所挖掘的知识进行解释,以一种用户易于理解的方式供用户所使用。
  数据挖掘按照其挖掘任务主要包括分类和预测、聚类分析、关联规则挖掘,回归发现和序列模式发现等技术。在选择某种数据挖掘技术之前,首先要将需要解决的问题转化成正确的数据挖掘任务,然后根据挖掘的任务来选择使用哪些数据挖掘技术。在电子商务活动中,主要使用下面的一些数据挖掘技术。
  5.1分类
  分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型或分类函数,将数据库中的数据项映射到某个给定的类别。分类的主要方法有基于决策树模型的数据分类,贝叶斯分类算法,ID3算法和基于BP神经网络算法等。
  假定现在我们有一个描述顾客属性的数据库,包括他们的姓名、年龄、收入、职业等,我们可以按照他们是否购买某种商品(例如,计算机)来进行分类。如果现在有新的顾客添加到数据库中,我想将新计算机的销售信息通知顾客,若将促销材料分发给数据库中的每个新顾客,如此可能会导致耗费较多的精力和物力。而若我们只给那些可能购买新计算机的顾客分发材料,可以在较大的程度上节省成本。为此,可以构造和使用分类模型。分类方法的特点是通过对示例数据库中的数据进行分析,已经建立了一个分类模型,然后利用分类模型对数据库中的其它记录进行分类。
  5.2聚类分析
  聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。聚类分析的方法是数据挖掘领域最为常见的技术之一。常用的聚类分析方法有:分割聚类方法,层次聚类方法,基于密度的聚类方法和高维稀疏聚类算法等。聚类分析方法与分类方法的不同之处是聚类事先对数据集的分布没有任何的了解。因此在聚集之后要有一个对业务很熟悉的人来解释这样聚集的意义。

核心期刊推荐