论文部分内容阅读
[摘 要]目前,随着社会经济的快速发展,人类已经进入了网络信息时代,随之产生了各种类型的数据海量。在这些数据的背后隐藏着许多重要的信息,如何从这些数据中找出某种规律,发现有用信息,越来越受到人们的重视。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘技术为海量信息的处理提供了科学和有效的手段。本文介绍了数据挖掘的概念、对象、任务、过程、方法、应用领域及其面临的挑战。
[关键词]计算机;数据;挖掘技术
中图分类号:G633.67 文献标识码:A 文章编号:1009-914X(2014)42-0134-01
计算机数据挖掘技术的产生是社会的一种进步,了解计算机数据挖掘对我们来说非常的重要,计算机数据挖掘在网络信息时代的今天对于任何一个企业来说都是非常的重要,我们要充分认识数据挖掘的概念、对象、任务、过程、方法和应用领域,只有充分地认识数据挖掘的概念、对象、任务、过程、方法和应用领域,我们才能够更好地完善和发展它。
1 计算机数据挖掘的概念及对象
1.1 计算机数据挖掘的概念
数据挖掘(Data Mining)是指基于一定业务目标下从海量数据中挖取潜在的、合理的并能被人理解的模式的高级处理过程。与传统的数据分析最大本质区别是数据分析所得到的信息具有先前未知、有效和实用三个特征,即数据挖掘是发现那些不能靠直觉发现的信息或知识,甚至违背直觉的信息或知识,挖掘出来的信息越出乎意料越有价值。
1.2 计算机数据挖掘的对象
计算机数据挖掘具有一定的针对性,计算机数据挖掘的对象(目标数据)并不是所有的数据,它是具有选择性的,计算机数据挖掘的对象主要是指企业中能够揭示一些未发现的隐藏信息和企业中比较有意义和研究价值的数据,明确这一点非常的重要,计算机数据挖掘的对象的选择性是影响计算机数据挖掘效率的主要因素,对于一个没有充分认识计算机数据挖掘对象的选择性的企业来说,它的计算机数据挖掘的效率会比成熟的计算机数据挖掘的企业或者是充分认识到计算机数据挖掘的对象的选择性的企业要低得多。同时,明确目标数据的类型也非常重要,它直接决定了要使用的数据挖掘技术和方法,大体上数据类型分为三类:记录数据,给予图形的数据和有序的数据。
2 数据挖掘的价值实现难点分析
数据挖掘是数据库中的知识发现,从知识发现到知识应用、再到价值评估是一条数据挖掘价值变现的过程,虽然数据挖掘重要性毋庸置疑;但事实上其转变商业价值之路仍有较多困难。
2.1 知识发现
知识发现是这条路的始端,直接决定了最终价值的高度。挖掘的方法是通用的,但难度不在挖掘技术,而在于实施人员对数据业务的理解,在于数据的质量。实施人员必须清楚的知道数据回收的场景和原理,稍有沟通缺失,都会影响知识的质量度。
2.2 知识应用
发现了知识,只是迈出第一步,需要将相关的知识发现交给业务部门进行运营使用。不管是以甲方公司还是乙方公司的形式存在,难点在于语言的翻译转发。数据挖掘的语言形式是概率形式,类如“连续三天内在站内搜索超过10次,浏览搜索结果相关页面20次以上的用户最终购买概率为42%”,因此需要实施人员深谙运营知识,将挖掘结果语言转化成运营结果语言,最终成为友好的商业运营智慧。应用的过程还需要及时跟踪、分析、调整,毕竟市场是多变的,分析与执行就像左脑和右脑,两者距离的远近,影响结果的优劣。
2.3 价值评估
数据挖掘的效果评估决定最终的话语和地位。从结果来看,如果结果有效,如何界定是知识有效还是执行有效;如果结果无效,如何界定是知识无效还是执行无效;如果知识有效,如何界定是通过挖掘发现还是已知发现。如果不能很清晰的界定,数据挖掘的存在价值都会大打折扣。曾经有个笑话,“通过我们海量数据发现,中国的15-20岁的男性网民最喜欢使用QQ即时通讯工具”,这样的知识发现虽然是个笑话,但在现实行业里是个不争的事实。数据挖掘的价值应当是显现的、直观的、令人信服的,不在于挖掘的技术多么高深,而在于整个体系的搭建和成果的展现,做的再好,看不到效果,等于无效。
3 计算机数据挖掘的技术方法、应用领域及挑战
3.1 计算机数据挖掘的技术
计算机数据挖掘有很多的专业技术,我们来简单介绍一下主要的计算机数据挖掘的技术:第一,计算机数据挖掘的统计技术。统计是计算机数据挖掘必不可少的技术,在数据清理过程中,统计提供数据发现极端值;第二,人工智能技术。人工智能技术是近些年来新兴的计算机数据挖掘的技术,它在数据挖掘中的应用比较广,它可以对数据进行推断和智能代理,是计算机数据挖掘的重要技术;第三,决策树方法。决策树方法是代表决策集合的单杆结构,它具有一定的分类规则,有一定的预测作用,是计算机数据挖掘的主要技术之一。
3.2 计算机数据挖掘的方法
随着近些年数据挖掘技术的广泛使用,数据挖掘的方法也在不断的进步和完善,现阶段主流的数据挖掘的方法有分类、关联规则、聚类分析等。分类是找出一组数据对象的共同特点并按照既定的分类模式将其划分为不同的类别。关联分析是描述数据之间所存在的关联规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。聚类分析是把一组数据按照相似性和差异性分为几个类别,使得属于同一类别的数据间的相似性尽可能大。
3.3 计算机数据挖掘的应用领域
计算机数据挖掘最大的应用领域就是商业领域,它能够为商业机构提供欺诈侦查和客户市场分类等数据。在这个高速发展的信息时代,网络是商业发展的主要推动因素,我们要使计算机数据挖掘在商业上的应用领域更广。以下是近些年来计算机数据挖掘的主要应用领域:第一,计算机数据挖掘在我国银行领域中的应用。银行是一个数据集中度和数据处理要求均非常高的领域,对于一个银行来说,每天都要面临着海量的数据,这些数据的挖掘分析对于银行来说是其发展的根本所在;第二,计算机数据挖掘在电子商务中的应用。电子商务是网络高速发展的产物,对于电子商务而言,海量数据的挖掘分析成为了电子商务未来发展的保证,因此,计算机数据挖掘在电子商务中的应用得到了快速的发展。
综上所述,数据挖掘技术是一新兴的研究领域,我们不仅要对数据挖掘的概念、对象、任务、过程、方法和应用领域进行充分的认识。尽管对数据挖掘的研究仍面临着诸多问题和挑战,还存在很多问题值我们去探索研究,但我们有理由相信在不久将来数据挖掘发挥的作用和价值会越来越大。计算机数据挖掘技术将会在各个领域得到广泛的应用,并对人类的活动产生深远的影响。
参考文献
[1] 周碧珍.浅析计算机数据挖掘技术在档案信息管理系统中的应用[J].黑龙江科技信息,2009(01).
[2] 朱世武.数据挖掘运用的理论与技术[J].统计研究,2003.
[关键词]计算机;数据;挖掘技术
中图分类号:G633.67 文献标识码:A 文章编号:1009-914X(2014)42-0134-01
计算机数据挖掘技术的产生是社会的一种进步,了解计算机数据挖掘对我们来说非常的重要,计算机数据挖掘在网络信息时代的今天对于任何一个企业来说都是非常的重要,我们要充分认识数据挖掘的概念、对象、任务、过程、方法和应用领域,只有充分地认识数据挖掘的概念、对象、任务、过程、方法和应用领域,我们才能够更好地完善和发展它。
1 计算机数据挖掘的概念及对象
1.1 计算机数据挖掘的概念
数据挖掘(Data Mining)是指基于一定业务目标下从海量数据中挖取潜在的、合理的并能被人理解的模式的高级处理过程。与传统的数据分析最大本质区别是数据分析所得到的信息具有先前未知、有效和实用三个特征,即数据挖掘是发现那些不能靠直觉发现的信息或知识,甚至违背直觉的信息或知识,挖掘出来的信息越出乎意料越有价值。
1.2 计算机数据挖掘的对象
计算机数据挖掘具有一定的针对性,计算机数据挖掘的对象(目标数据)并不是所有的数据,它是具有选择性的,计算机数据挖掘的对象主要是指企业中能够揭示一些未发现的隐藏信息和企业中比较有意义和研究价值的数据,明确这一点非常的重要,计算机数据挖掘的对象的选择性是影响计算机数据挖掘效率的主要因素,对于一个没有充分认识计算机数据挖掘对象的选择性的企业来说,它的计算机数据挖掘的效率会比成熟的计算机数据挖掘的企业或者是充分认识到计算机数据挖掘的对象的选择性的企业要低得多。同时,明确目标数据的类型也非常重要,它直接决定了要使用的数据挖掘技术和方法,大体上数据类型分为三类:记录数据,给予图形的数据和有序的数据。
2 数据挖掘的价值实现难点分析
数据挖掘是数据库中的知识发现,从知识发现到知识应用、再到价值评估是一条数据挖掘价值变现的过程,虽然数据挖掘重要性毋庸置疑;但事实上其转变商业价值之路仍有较多困难。
2.1 知识发现
知识发现是这条路的始端,直接决定了最终价值的高度。挖掘的方法是通用的,但难度不在挖掘技术,而在于实施人员对数据业务的理解,在于数据的质量。实施人员必须清楚的知道数据回收的场景和原理,稍有沟通缺失,都会影响知识的质量度。
2.2 知识应用
发现了知识,只是迈出第一步,需要将相关的知识发现交给业务部门进行运营使用。不管是以甲方公司还是乙方公司的形式存在,难点在于语言的翻译转发。数据挖掘的语言形式是概率形式,类如“连续三天内在站内搜索超过10次,浏览搜索结果相关页面20次以上的用户最终购买概率为42%”,因此需要实施人员深谙运营知识,将挖掘结果语言转化成运营结果语言,最终成为友好的商业运营智慧。应用的过程还需要及时跟踪、分析、调整,毕竟市场是多变的,分析与执行就像左脑和右脑,两者距离的远近,影响结果的优劣。
2.3 价值评估
数据挖掘的效果评估决定最终的话语和地位。从结果来看,如果结果有效,如何界定是知识有效还是执行有效;如果结果无效,如何界定是知识无效还是执行无效;如果知识有效,如何界定是通过挖掘发现还是已知发现。如果不能很清晰的界定,数据挖掘的存在价值都会大打折扣。曾经有个笑话,“通过我们海量数据发现,中国的15-20岁的男性网民最喜欢使用QQ即时通讯工具”,这样的知识发现虽然是个笑话,但在现实行业里是个不争的事实。数据挖掘的价值应当是显现的、直观的、令人信服的,不在于挖掘的技术多么高深,而在于整个体系的搭建和成果的展现,做的再好,看不到效果,等于无效。
3 计算机数据挖掘的技术方法、应用领域及挑战
3.1 计算机数据挖掘的技术
计算机数据挖掘有很多的专业技术,我们来简单介绍一下主要的计算机数据挖掘的技术:第一,计算机数据挖掘的统计技术。统计是计算机数据挖掘必不可少的技术,在数据清理过程中,统计提供数据发现极端值;第二,人工智能技术。人工智能技术是近些年来新兴的计算机数据挖掘的技术,它在数据挖掘中的应用比较广,它可以对数据进行推断和智能代理,是计算机数据挖掘的重要技术;第三,决策树方法。决策树方法是代表决策集合的单杆结构,它具有一定的分类规则,有一定的预测作用,是计算机数据挖掘的主要技术之一。
3.2 计算机数据挖掘的方法
随着近些年数据挖掘技术的广泛使用,数据挖掘的方法也在不断的进步和完善,现阶段主流的数据挖掘的方法有分类、关联规则、聚类分析等。分类是找出一组数据对象的共同特点并按照既定的分类模式将其划分为不同的类别。关联分析是描述数据之间所存在的关联规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。聚类分析是把一组数据按照相似性和差异性分为几个类别,使得属于同一类别的数据间的相似性尽可能大。
3.3 计算机数据挖掘的应用领域
计算机数据挖掘最大的应用领域就是商业领域,它能够为商业机构提供欺诈侦查和客户市场分类等数据。在这个高速发展的信息时代,网络是商业发展的主要推动因素,我们要使计算机数据挖掘在商业上的应用领域更广。以下是近些年来计算机数据挖掘的主要应用领域:第一,计算机数据挖掘在我国银行领域中的应用。银行是一个数据集中度和数据处理要求均非常高的领域,对于一个银行来说,每天都要面临着海量的数据,这些数据的挖掘分析对于银行来说是其发展的根本所在;第二,计算机数据挖掘在电子商务中的应用。电子商务是网络高速发展的产物,对于电子商务而言,海量数据的挖掘分析成为了电子商务未来发展的保证,因此,计算机数据挖掘在电子商务中的应用得到了快速的发展。
综上所述,数据挖掘技术是一新兴的研究领域,我们不仅要对数据挖掘的概念、对象、任务、过程、方法和应用领域进行充分的认识。尽管对数据挖掘的研究仍面临着诸多问题和挑战,还存在很多问题值我们去探索研究,但我们有理由相信在不久将来数据挖掘发挥的作用和价值会越来越大。计算机数据挖掘技术将会在各个领域得到广泛的应用,并对人类的活动产生深远的影响。
参考文献
[1] 周碧珍.浅析计算机数据挖掘技术在档案信息管理系统中的应用[J].黑龙江科技信息,2009(01).
[2] 朱世武.数据挖掘运用的理论与技术[J].统计研究,2003.