浅谈Web数据挖掘技术在电子商务中的应用

来源 :中国学术研究 | 被引量 : 0次 | 上传用户:haoz8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文主要介绍电子商务中Web挖掘,尤其是Web使用挖掘的主要研究对象、研究方法,提出了电子商务个性聚类模型,即客户聚类及页面聚类的各种算法。随着电子商务的日益普及,对Web使用数据的处理也将不断受到人们的重视,而寻找更具有Robust(鲁棒性)的挖掘算法以及如何对挖掘的结果进行更深层次的评价正是目前我们研究的重点。
  关键词:电子商务;Web数据;挖掘;研究等
  一、电子商务中Web挖掘的发展状况
  现阶段电子商务正在企业和商贸领域占据着越来越多的市场氛围,Web挖掘主要用于商品的市场定位和销售分析,以辅助制定市场策略,还可以用来分析购物模式,预测销售行情。同时世界上的主要数据库厂商也纷纷开始把数据挖掘功能集成到自己的产品中。IBM、Microsoft等大公司都在自己的产品或相应产品上增加了在线分析处理(OLAP)。IBM公司开发的QUEST和Intelligent Miner系统可以挖掘客户的购物行为模式。Microsoft公司日前发布了一个基于XML的数据访问协议,该协议能使开发商为各类客户和开发平台提供数据分析。XWL for Analysis是一个支持应用开发商将商业智能植入。NET Web服务的协议。随着OLE DB for OLAP(联机分析处理)和OLE DB for Data Mining(数据挖掘)的发展,该协议支持对Microsoft数据源的访问并支持基于Web的数据挖掘。我国在这一领域正处在研究开发阶段,应用和产品还相对滞后,但现在正在起步,因为这一新兴领域不但有很好的研究和应用前景,而且有很好的商业机会。
  二、Web挖掘中的技术问题
  根据挖掘的对象不同,我们可以把基于Web内容挖掘数据分为三大类:Web内容挖掘、Web结构挖掘、Web使用挖掘。Web使用挖掘也称为Web日志挖掘(Web Log Mining)。与前两种挖掘方式以网上的原始数据为挖掘对象不同,Web使用挖掘面对的是在用户和网络交互的过程中抽取出来的第二手数据。
  Web使用挖掘将这些数据一记录到日志文件中,然后对积累起来的日志文件进行挖掘,从而了解用户的网络行为数据所具有的意义。在Web使用挖掘中,出于商业目的的考虑,网站的拥有者或者管理者经常会对网站的某些方面提出一些分析,比如:流量分析(点击量)、广告分析、网站出入口分析、访问路径分析、用户来源分析、浏览器和平台分析等等。就这些方面作进一步的智能分析,我们可以从中真正与数据挖掘相关的问题。
  网页相关性分析:分析那些网页具有密切的关系,如果很多人具有a.html-b.html-c.html这样的访问模式,则我们可以认定a.html 和c.html之间有一定的关系,从而考虑是否在a.html上直接加上c.html的链接。
  用户访问模式分析:分析有哪一些网页,用户只要访问了其中的一页,则可以断定他也要访问其它的网页?即按不同的用户访问模式把网页分组,得到一个一个的兴趣点。哪些用户所访问网页组成比较类似(具有类似的兴趣)即根据用户行为的相似性把用户按行为模式分类。
  用户归类:通过用户填写的信息如何把用户归入某一特定的类别,然后可对同一类别中的用户提供相似的服务。
  三、电子商务中Web挖掘过程和方法
  1、电子商务中Web挖掘的过程
  在Internet电子商务中,客户浏览信息被Web服务器自动收集并保存在访问日志、引用日志和代理日志中。这些日志数据信息被组合应用计算机进行处、神经元网络、模型化算法和其它信息处理技术手段,进行分析加工,从中可以得到商家用于特定消费群体或个体进行定向营销的决策信息。同时有效地对这些Web日志进行定量分析,接示其中的关联关系、时序关系、页面类属关系、客户类型关系和频繁访问路径、频繁访问页面等,不但可为优化Web站点拓扑结构提供参考,而且还可为企业更有效地确认目标市场、改进决策获得更大的竞争优势提供帮助。
  2、电子商务中Web挖掘的方法
  (1)预处理。预处理主要有两部分构成:数据清洗(data cleaning)和事务识别(transaction identification) 。包括对Web日志进行清洗、过滤和转换以及无关记录的剔除,判断是否有重要的访问没有被记录,并从中抽取感兴趣的数据;并将URL、资源的类型、大小、请求的时间、在资源上停留的时间、请求者的Internet域名、用户、服务器状态作为数据cube的维数变量;再将对模块、页面和文件的请求次数,来自不同Internet域名请求次数、事件、会话、带宽、错误次数、不同浏览器种类、用户所在组织作为度量变量建立data cube;而将文件、图像脚本及多媒体等其它文件转换成可用于Web使用挖掘的数据格式,从而可将数据挖掘技术用于Web流量分析、典型的事件序列分析和用户行为模式分析及事务分析。
  (2)模式发现。用户访问模式的发现,可采用统计学(statistics)、模式识别(model identification)、人工智能(A I)、数据挖掘(data mining)等领域的成熟技术在Web使用记录中挖掘知识。这些从其它领域移植到Web挖掘的技术,仍需要对Web挖掘领域的特点做出相应的修改和完善才能进行成功移植。在经过数据预处理阶段后,即可根据不同的需求选择模式发现技术。
  (3)模式分析。Web使用挖掘中的模式分析,主要是为了在模式发现算法找到的模式集合中发现有趣模式。开发各种Web分析技术和工具,可辅助分析人员加深理解并使各种挖掘方法得到的模式获得充分利用。
其他文献
摘 要:工程设计是建设项目进行全面规划和具体描述施工意图的过程,是工程造价全过程控制的关键阶段。工程造价控制贯穿整个建设过程,但在可行性研究报告被批复后,设计阶段成了投资控制最关键的阶段。据研究统计,设计费虽然仅占全部投资的1.6%-4.5%,但它对工程造价控制的影响程度却高达75%。由此可见,认真做好工程设计,使设计的产品工艺先进适用、经济合理,对控制建设项目的工程投资极为重要。  关键词:设计
期刊
社会生产力的的发展,总要选择适合自身要求的经济形式。市场经济正是作为一种适合当今朝代社会生产力发展的有效的经济形式,在世界各国普遍实行,也成为社会主义国家的历史选择。  一、社会主义实行市场经济的根本动因  解放和发展生产力,加快实现现代化,这是我国社会主义条件下实行市场经济的根本动因。  社会主义的根本任务是解放和发展生产力,这是社会主义本质的一个重要内容和要求。社会主义作为继承并高于先前一切社
期刊
财务报告,也称财务会计报告,是指企业对外提供的反映企业某一特定日期财务状况和某一会计期间经营成果、现金流量的文件。财务报告包括会计报表、会计报表附注和财务情况说明书。财务报告作为会计信息的综合表达和载体之一,其基本目标是向信息使用者提供决策有用的会计信息。财务报告的质量高低也就取决于其所提供的会计信息的质量好坏。然而,财务报告不是孤立存在的,而是存在于一定会计环境中的企业。企业所处的会计环境又会随
期刊
摘要:为探讨如何利用传统国学塑造现代人才,以《论语》为主要文献,发现子路作为孔子的弟子,在《论语 》中出现了42次,在其他文献中也有分散的记载。孔子在先秦时期就成功地用 “礼”改造了子路的“侠”,由此形成了儒侠精神。其过程包括“率尔”改造成“三思”、“原始反叛”改变成“和而不同”、“好勇”升华成“义勇”三点。这对研究先秦文化的交融、如何面对现代社会侠义的缺失、如何构建和谐社会都有启发意义。  关键
期刊
摘 要:本文主要从房地产经济管理的基本原则、存在问题以及有效对策三个方面进行了简单探讨。  关键词:房地产经济;原则;问题;对策  近年来,房地产产业被公认为是我国国民经济发展的支柱性、先导性产业,是我国发展宏观经济的重要力量。房地产经济是我国社会经济活动的重要内容,房地产市场是整个市场体系中的重要有机组成部分。由此看来,房地产经济的重要性是不言而喻的,对国家社会经济的发展影响深远。目前,随着我国
期刊
摘要: 随着信息科技的不断进步,交际手段日益多元化,信息传播也进入“视觉化”时代。认知语言学对概念隐喻的研究也不再束缚于纯语言层面,转向多模态意义的探索。本文以益达无糖口香糖宣传广告“酸甜苦辣”为例,分析这则微电影所包含的多模态隐喻,探究该广告是如何对不同模态的概念隐喻进行整合以达到广告的正面诉求的。  关键词:概念隐喻;多模态;多模态隐喻;广告  1.引言  古往今来,有关隐喻的研究源远流长。传
期刊
摘 要:本文通过对理解教育内涵的阐述及实地调查,发现云南少数民族文化认同薄弱,民族自我理解和被理解不足,民族标识濒临消亡。作者提出从家庭、社区和学校三种途径加强云南各民族之间的理解教育,并提出少数民族地区多元文化理解教育的支撑体系。  关键词:理解教;途径;支撑体系;多元文化  云南的边疆少数民族受到地域文化和主体民族文化的冲击,少数民族自身的民族认同感薄弱,民族文化的标识趋于消亡。在挖掘正在消失
期刊
摘 要:建筑施工企业工程项目造价控制,是施工企业在工程项目开工前费用的分解与确定,在施工过程中费用的控制、监督和管理,在竣工验收后对费用进行分析总结。文章分别从事前、事中和事后三个方面论述了工程造价的控制方法,通过以上三方面的工作确保项目目标的实现,同时,在施工中能够合理地使用人力、物力、财力,最终取得较好的经济效益。  关键词: 施工企业;工程造价;控制  我国经济的发展由原来计划经济到市场经济
期刊
摘 要:本文简要分析了车辆维修保障信息化建设面临的问题,提出了车辆维修保障信息化建设的对策,从信息融合、完善网络平台和人才建设等三个方面,论述了推进车辆维修保障信息化建设的途径。  关键词:车辆,维修保障,信息化网络平台  一、车辆装备维修信息化建设现状  (一)建设起点低且资源浪费较大  随着车辆装备保障的不断发展尤其是信息技术的不断应用,我军车辆装备保障能力得到了显著的提高,但是相比美军等发达
期刊
企业文化建设需要通过思想政治工作的加强和改进来保证,既要高度重视思想政治工作,又要在继承优良传统的基础上改革创新,以适应现代企业制度的发展要求。在企业文化建设中, 不但要加强和改进思想政治工作,而且还必须掌握科学的方法,这样才能形成有利于企业文化建设的政治思想环境,拓宽思想政治工作的渠道,增强思 想政治工作的吸引力和凝聚力。  一、企业文化与企业思想政治工作的统一性  思想政治工作必须与企业文化建
期刊