电子商务中的数据挖掘技术研究

来源 :中国电子商情 | 被引量 : 0次 | 上传用户:iam156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  引言:在电子商务中对数据挖掘技术进行应用,能够有效地组织利用丰富的数据源信息,挖掘出对电子商务有重要价值的信息。本文对电子商务中的数据挖掘技术进行了详细的研究,分析了电子商务中对数据挖掘技术的应用,然后从数据信息与挖掘任务两个角度指出了数据挖掘技术的适用场合。
  当前,数据库技术和网络技术的发展日趋成熟,世界上传统商务也正在经历一次重大的改革,电子商务成为发展重点。电子商务的一个重要应用技术就是数据挖掘技术,并且数据挖掘技术可以给正确的商业决定提供可靠的保证和强有力的支持,因此,数据挖掘技术被认为是电子商务中必不可少的工具。
  一、数据挖掘技术的概念和应用
  数据挖掘就是对数据仓库中存储的大量数据进行挖掘,来找出有意义的新的关联趋势和关联模式的过程。从商业的角度看,数据挖掘技术是一个对商业信息进行处理的新技术,具有能够分析、转换、抽取和其他模型化处理商业数据库中大量业务数据,从中提取出能够辅助商业决定的关键性数据的特点。
  因为数据挖掘可以给电子商务带来显著的经济效益,所以其在电子商务中也有越来越广泛的应用。
  数据挖掘应用于零售业,能够帮助商家识别顾客的购买行为,发现顾客的购买趋势和模式,从而可以帮助商家有针对性的提高服务质量,获得更好的顾客满意度与顾客保持力,提高货物的销量,设计出更好的货物分销与运输方法,降低商业成本。
  数据挖掘应用于金融领域,能够帮助管理者分析客户的信用情况与偿还能力,并对其进行分类和评级,从而降低放贷的错误率,提升资金的使用效率。通过数据挖掘,还可以找到在偿还中有决定作用的主导因素,制定相应的金融策略,还能够发现洗黑钱和其它金融犯罪活动。
  二、如何选择正确的数据挖掘技术
  数据库方法、神经网络方法、机器学习方法和统计方法都是数据挖掘所使用的技术。本文将从可获得的数据与数据挖掘任务两个方面来说明如何选择正确的数据挖掘技术。
  2.1 可获得的数据
  数据挖掘可获得的数据信息主要是内容、记录和字段类型之间的关系,并且对数据挖掘技术的选择有影响的数据性质有以下几个:
  第一,数值字段:聚集检测和MBR使用距离函数对数值字段进行处理;神经元网络把所有的输入转化到0-1之间;决策树使用splitter数值对数值字段进行处理;关联分析需要把数值变量区间转化为种类变量区间,但是区间的选择十分困难。
  第二,种类字段:决策树、连接分析、关联分析都很适用于种类字段。
  第三,多个非独立的目标字段:神经元网络可以很好地应用于存在多个依赖变量的情况。
  第四,自由文本数据:采用MBR技术是最佳选择。
  第五,具有时间顺序的数据:关联规则、神经元网络对有时间顺序的数据有比较好的处理能力。时间顺序也可以用决策树处理,但是需要准备较多的数据。
  第六,每条记录都有大量独立的字段:关联规则挖掘、MBR技术、神经元网络都会受到记录中字段多的影响。但是决策树就会受到程度较小的影响。
  第七,变长的记录:只有连接分析和关联规则能够对变长的记录进行处理,而如果使用其它技术,就需要对数据进行预处理:把一条记录拆分为几条记录,每个都含有记录号;能够生成一些统计字段。
  2.2 数据挖掘任务
  从数据中发现模式是数据挖掘的任务。在对某种数据挖掘技术进行选择之前,第一,要把需要解决的商业问题转化成正确的数据挖掘任务;第二,依照数据挖掘的任务来决定使用几种或者是哪一种数据挖掘技术。以下将以聚集和概念描述为例,对挖掘任务需要使用哪些挖掘技术进行分析。
  (1)聚集。聚集就是把整个数据库分为不同的群组。其目的是使同一个群之间的数据尽量相似,而不同的群之间要有很明显的差别。协助市场分析人员在客户基本信息库中找出不同的客户群,并用购买模式对不同客户群的特征进行刻画是电子商务中对聚集的典型应用。另外,聚类分析也能作为分类、特征等其他算法的预处理步骤,这些算法可以再在生成的簇上进行处理。聚集与分类不同的是,在开始之前一般不知道该把数据分成几组和怎样分,所以要有一个对业务特别熟悉的人在聚集之后对这样分群的意义进行解释。一般情况下,需要经过几次反复的增加或删除变量才能得到理想的结果。
  (2)概念描述。描述式数据挖掘的最基本形式就是概念描述。概念描述以简洁汇总的形式对给定的任务的相关数据集进行描述,提供数据的一般特征。一般,通过数据库来查询收集用户指定类的数据。有两种概念特征化的一般方法:面向属性归纳的方法和基于数据立方体OLAP的方法,这两种方法都是基于维或属性的概念化方法。一般使用面向数据库的方法实行概念描述挖掘,并且还能够采用机器学习方法中的基于范例学习的技术来进行。
  三、小结
  选择能够解决电子商务中一些问题的数据挖掘技术的时候,需要根据具体问题的特点来选择合适的技术方法,在选择了符合数据模型的算法之后,就要确定正确的模型与参数。并且要想很好的发挥数据挖掘能够帮助企业在激烈的竞争中做出正确决定的作用,就必须选对合适的数据挖掘工具。
  参考文献
  [1]胡永祥.电子商务系统中的数据挖掘技术研究[J].电子世界,2013,(24):25-25.
  [2]徐羡文,郑厦君.数据挖掘技术在电子商务推荐中的应用[J].电脑知识与技术,2011,07(27):65-66.
  [3]杨波.浅谈数据挖掘技术应用[J].电脑知识与技术,2010,06(24):82-83.
  (作者单位:江西经济管理干部学院)
其他文献
引言:自动化技术新时期科学技术发展的产物,具有实时监控、集中管理、智能控制等多方面的特点,能够综合提高生产工作的效率。目前自动化技术应用于很多领域,输油生产工作中也逐渐引入了该技术。自动化技术能够让输油生产设备和系统实现自动化,提高了监控效果,系统还能够实现自动保护,从而使输油生产更加安全。虽然自动化技术应用优点众多,但也存在很多问题。本文就目前输油生产中存在的诸多问题,从多方面介绍自动化技术的应
期刊
引言:我国的煤炭交易在我国经济发展中一直起着重要作用,煤炭的交易也在我国能源经济中占据主导地位。人们除了关注煤炭的售价,还非常关注在销售时煤炭的物流管理,更好的对煤炭交易中物流管理进行统筹,完善的建立交易体系,收到大量煤炭企业的广泛关注。只有不管找到物流管理的合理方案,并参考相关管理意见,才能更好的管理煤炭运输的物流。  一﹑煤炭运输物流管理存在的问题  物流管理这个行业在我国的发展和兴起比较晚,
期刊
引言:随着科技的发展,机电一体化产品已经涉及到了机械、电气、控制等领域,单功能、独立领域的设计,已经无法满足日益增长的需求,所以将机电一体化产品基于虚拟原型进行设计,是时代发展的必然趋势。本文对于虚拟原型的机电一体化建模与仿真技术进行了研究。  机电一体化又被称做机械电子工程,是机械工程与自动化的结合产品。随着机电一体化技术的快速发展,机电一体化被人们广泛接受,并普遍应用于各个领域,尤其是随着计算
期刊
本文针对于我国网络保险的发展现状,结合保险法和电子合同相关立法研究了网络保险合同的实质及其法律效力,网络保险合同当事人及其身份资格确认,网络保险合同签订过程,网络保险合同中的要约及承诺,最终根据研究提出我国未来网络保险合同部分的立法的政策建议。  一、引言  2013年8月,保监会发布实施《关于专业网络保险公司开业验收有关问题的通知》,为专业网络保险公司的成立提供了法律保障,2013年9月29日,
期刊
引言:档案管理有利于医院的综合发展,加强医院档案管理对领导决策、医院发展具有重要意义。本文就医院档案管理中常见问题进行探讨,针对医院档案管理中存在的问题找出有行之效的解决方法,以提高档案管理水平及利用率,促进医院的发展  科学有效的档案管理有利于医院的综合发展,为医院长远发展提供准确的决策,为医院现代化管理打下坚实基础;有利于医疗技术与医疗质量的有效管理,对调整各项医疗指标、技术指标提供准确、真实
期刊
引言:我国的计划生育政策已经走过三十多个岁月,已经深入人心。而我国在控制人口数量,提高人口质量方面也取得了可喜的成绩。随着我国经济发展水平的提高和我国人口结构的变化,目前我国已经开始实行单独二孩的政策,事业单位的计生管理工作也成为了社会关注的焦点,本文从当前我国计生现状、计生管理工作的新途径以及影响等多个方面进行简述,希望为事业单位的计生管理工作提供理论意见。  一、我国计划生育工作的现状  自从
期刊
引言:本文在城市道路发生交通事故的实际背景下考虑其对交通通行能力的影响,通过建立非线性拟合模型考察事故对交通影响程度与具体因素的关系。找出事故路段车辆排队长度与事故横断面实际通行能力、事故持续时间、路段上游车流量的关系。  概述  我们选取一交通事故事发路段在事发前后二十分钟的视频为研究对象,分析研究事故发生后车辆排队长度与事故横断面实际通行能力、事故持续时间、路段上游车流量间的量化关系。我们建立
期刊
引言:现如今,档案的管理存在许多问题,档案管理的规范化在各项工作的发展与建设中有很重要的作用。本文将从档案管理工作中存在的问题着手,实现对档案管理的规划化进程的探索。  档案管理涉及的工作内容较为细致,工作中需要人力与物力的协调配合才能够顺利完成。在多年的档案管理工作经验中,逐渐总结出了档案管理中存在着的主要问题,根本症结都在档案管理体系与进程未能实现规范化。认真分析目前档案管理中存在的问题,推进
期刊
引言:无线网络是一个开放的架构,是与有线网络的不同架构,开放式体系结构可以非常方便的进行交流,但在网络的安全问题上也带来了很大的风险,因此,本文设计了基于自我调节机制的新型无线网络安全模型。它由三个模块组成:检测模块、安全模型管理模块和备份模块,入侵检测实验中与传统模型PPDR相比,本文设计的安全模型可以有效地拦截危险的数据。  一、概述  随着无线网络和智能移动设备的高速发展,它将为人们的生活带
期刊
引言:当前PLC技术在电梯并联控制系统之中有着重要的应用,所以深入的对技术难点和重点加以分析,将全面促进系统设计工作的完善及健全。文章将针对这一方面的内容展开论述,详细分析了PLC在电梯并联控制系统之中的具体应用,同时对PLC的有关概念和应用设计的重难点等进行了综合性的研究,旨在以此为基础,不断促进相关系统设计工作的完善,为新时期的建设事业不断发展奠定基础。  引言  随着我国科学技术不断向前发展
期刊