Web数据挖掘技术在商务中的应用

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:yin2002cn2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   摘要:数据挖掘是最近几年来随着数据库技术和人工智能技术的发展与应用而出现的一种全新的信息技术。随着电脑的普的广泛应用,使Web成为获取各方面信息的最重要的途径。Web凭借着自身的卓越条件,是它占据了主要市场。本人根据个人对计算机Web的了解和有关资料的介绍通过各方面对Web数据挖掘过程,以及特点的讲述,并且着重研究了Web数据挖掘技术在当代商业中的应用,特别是电子商务方面。
   关键词:数据挖掘;人工智能;载体;电子商务
   中图分类号:TP311.13 文献标识码:A 文章编号:1007-9599 (2011) 23-0000-01
   Web Data Mining Technology Applications in Business
   Zhang Jing,Zhou Shuchen
   (Huanghuai University,International College,Zhumadian 463000,China)
   Abstract:Data mining is the most recent years,database technology and artificial intelligence technology with the development and application of the emergence of a new information technology.With a wide range of general computer applications,so as to obtain all aspects of Web information of the most important way.With its excellent Web condition,it occupies a major market.I have Web-based personal computers and relevant information about the introduction of Web data mining through the process of all parties concerned,and the characteristics of the talk,and focused on the technology of Web data mining in the contemporary business applications,especially e-commerce.
   Keywords:Data mining;Artificial intelligence;Carrier;E-commerce
  一、对Web数据挖掘的综合概述
   Web挖掘是从Web资源上抽取所需信息的过程,它是将传统的数据挖掘的思想和方法应用于Web。Web数据挖掘在很多方面都发挥着主导作用,如搜索引擎结构的数据挖掘,搜索引擎的开发,改进和提高搜索引擎的质量和效率,确定权威页面。Web挖掘研究覆盖了多个研究领域,包括数据库技术、信息获取技术等。特别是在电子商务领域,通过对用户特征的理解和分析,如对用户访问行为、频度、内容等的分析,提取出用户的特征,从而为用户定制个性化的界面,有助于开展有针对性的电子商务活动。
  二、Web数据挖掘的特点
   (一)半结构化数据。Web页面以某种格式呈现的半结构化数据,其数据不完整、结构不规则,复杂程度与普通文本相比远远高于普通的文本文档,其数据结构隐含、模式信息量大、模式变化快。大量的文档无任何排列次序,无分类索引。
   (二)Web是一个异质、分布、动态的信息源。Web及其数据无固定的模式且更新、增长速度极快。Web上的信息几乎都是隐藏的、潜在的、未知的,从Web上发现这些未知的信息和有用的模式,仅用传统的基于关键字的检索方式很难实现,现在的搜索引擎尚不具备这些功能。
   (三)面对一个非常广泛不同类型的用户群体,不同的用户对访问Web的爱好和使用目的各不相同,根据不同的用户,能否使用户根据自己的爱好兴趣定制网页,甚至能否根据发现的用户自动为用户定制网页,从而提供个性化的信息检索和查询服务。
   三、Web数据在电子商务中的挖掘过程
   (一)数据预处理。它包括数据清理、用户识别、用户会话识别、访问路径补充和事务识别等步骤。数据清洗的目的是删除Web日志中与数据不相关的冗余项,缩小被挖掘数据对象的范围。在数据净化后就必须确定单一的用户,用户识别的目的就是对用户惟一性的识别。
   (二)模式识别。通常对即将处理之后的数据进行处理进而得到相应的事务数据库。在事务数据库的基础上度数据进行挖掘,总的来说需要进行一下两个方面的工作:其一将事务数据库进行整理使之变换成与一定挖掘技术相适应的数据存储形式;其二利用数据挖掘算法挖掘出更加有效的、新奇的、潜在的、有用的且可以进行实际研究的信息和知识。可用于Web的挖掘技术有路径选择、关联、分析、分类规则、聚类分析、序列分析、依靠性建模等。
   (三)模式分析。该阶段的主要任务是从上一阶段收集的数据集中过滤掉不喜欢的或无关联的数据及模式,进而发现有趣模式。最常见的模式分析方法是SQL语言知识查询机制,也可以利用存储Web使用数据的数据库进行数据导入,再利用OLAP方法发现数据中的特定模式结果。
   (四)可视化。主要是采用可视化的技术以图形界面的方式表示挖掘的成果。
   四、Web数据挖掘技术在电子商务中的应用
   (一)挽留老顾客。挖掘潜力在于客户通过Web挖掘,电子商务的经营者可以获的每位访问者的个人信息,充分地了解客户各方面的需要,然后根据每一类顾客的独特需求向他们提供特定的产品,并根据需求动态地向客户做页面推荐,从而调整Web页面,提高客户对所需产品的满意度,延长客户在网页的驻留时间,最终达到留住客户的目的。通过Web日志记录的充分挖掘,首先可以对已经存在的访问者进行分类,然后从所分的类别中判定出某个新客户是否是潜在的客户。
   (二)制定产品营销策略,优化促销活动。通过对商品访问情况和销售情况进行挖掘,企业能够准确的获得客户的访问规律,确定顾客进行消费的生命周期,然后根据当前市场需求的变化,针对不同的产品制定相应的营销策略。
   (三)降低运营成本,提高企业竞争力。电子商务的经营者通过Web数据挖掘,可以获得可靠的客户对产品的反馈信息,认真分析消费者的将来消费动向,进行有针对性的电子商务营销活动,还可以根据客户对某产品浏览模式和访问次数来设置广告的位置,进而增加了广告的针对性,提高广告的投资回收率,从而降低运营成本,提高企业竞争力。
   五、结束语
   随着计算机技术的迅发展和Internet资源的快速增长,特别是电子商务的兴起,Web挖掘成为二十一世纪的热门研究领域之一,其研究具有更加广阔的应用前景和巨大的现实意义。就目前国内的Web挖掘看还尚处于学习、跟踪和探索阶段,Web挖掘有许多问题有待于进一步的研究和深化,希望未来的发展能更好的服务于社会。
   参考文献:
   [1]凌传繁.Web挖掘技术在电子商务中的应用[J].情报杂志,2006
   [2]郝先臣.基于电子商务中的数据挖掘技术研究[M].小型微型计算机系统,2007
   [3]韩家炜.王静Web挖掘研究[J].计算机研究与发展,2006
   [4]邓英.李明.Web数据挖掘技术及工具研究[M].计算机工程与应用,2008
   [作者简介]张敬(1982-),女,河南驻马店人,研究生,主要研究方向:数据挖掘;周书臣(1983-),男,河南省正阳县人,助教,硕士,主要研究方向:信息隐藏,数字水印。
其他文献
研究并建立了鸡饲料中角黄素、虾青素等5种类胡萝卜素的超高效液相色谱分析法。采用乙腈提取饲料样品后,将提取液直接进行进样分析。色谱柱为Waters BEH C18(1.7 m,2.1 mm&#21
利用二维灰度直方图方法对于有噪声的图象进行分割,可以取得比较满意的效果,但是该方法时间复杂度高,耗时长,因此,如何设法减少运算时间就显得很必要。
当今社会,计算机信息化建设迅速发展,计算机在日常工作、生活中的各个领域均得到了普遍的应用,比如政府机关、医院、学校、家庭等。但其繁荣的背后亦是巨大的计算机网络安全威胁
生活处处有数学,数学也来源于生活。数学与生活息息相关,有着密不可分的联系。在初中数学的教学课堂中,作为一名数学教师不仅仅需要具备一定的教学经验与教学理论,更需要将数学融
脱贫攻坚的号角声响起,对接帮扶的政策措施落地。贫困地区贫困户的欢声笑语,才是真正体现扶贫成效的声音。位于长江南岸的永乐镇,幅员面积156.8平方公里,辖10个行政村(含3个
网络聊天以它低成本,高效率的优势给网络用户提供了在线实时通信的功能,从而成为目前互联网使用最广泛的网络服务。以网络聊天室的探测为载体深入研究网页获取和预处理的技术
在平常的化学习题中,经常遇到这么一类题:当一种物质和另外两种物质都会发生反应,学生弄不清楚该如何下手解题,不知道如何分析.本文对这类题进行了归纳总结.主要有四种类型,对这四种
用厚皮甜瓜单性花材料(雌雄异花同株)作母本,对薄皮甜瓜品种(雄全同株)进行单性花转育,杂交F1代均表现为雌雄异花同株,F2代表现为雌雄异花同株和雄全同株3:1的分离比例,回交后代出现雌
休闲农业作为一种以生产为基础的农业高级新型产业形态与消费业态,发展受到生产要素的影响,解释其影响的相关研究文献鲜有见著。笔者以《福建省休闲农业发展十二五规划》编制进
目前,高校数万名师生需要在每学期开始的短短一个月时间内,完成上一年度的教育评优申请和审批工作。从申请表填写、上报,到申请的逐级审批,所有的工作都需要由手工完成,具有明显的