论文部分内容阅读
摘 要:近几年来,数据挖掘逐渐成为智能化信息系统的重要研究内容,得到信息行业的广泛关注。这篇文章将在简要论述数据挖掘概念的基础上,对其未来发展的优化措施进行探讨。
关键词:数据挖掘;特点;应用;优化;
中图分类号:C37 文献标识码:A
二十一世纪是信息科学技术迅猛发展的时代,各行各业中有效数据的飞速增长,使人们处于海量的信息海洋中,为了进一步提高工作效率和市场竞争力,人们需要想尽一切办法对信息进行科学、准确的分析,并从中提炼出对未来发展或目前运营有利的信息资源;但是传统意义上的信息储存也好、信息检索也好既费时又费力,很难满足现代化经济发展的要求,而数据挖掘就是在这种经济环境中应运而生。
一、数据挖掘的基本概念
就目前来看,数据挖掘已经成为信息领域创新发展的重要内容,简单来看,数据挖掘就是从海量的数据信息中选择出对企业经营决策有关的直接信息或者潜在信息;之前出现的机器学习也好、统计学及模式识别也好,虽然在一定程度上能够帮助人们发现有效信息,但是其应用的范围很狭窄,大多是在科研领域,很难实现大面积的传播,数据挖掘的出现充分结合了上述几种方法的优势,实现了对信息进行精确、有效的整合。
从根本上来看,数据挖掘的本质目的就是从数据库模糊的、海量的、随机的的数据中检索出有使用价值的潜在信息资源;虽然数据挖据并没有明确搜索条件,但是它能够自动发现数据库中隐藏的预测趋势以及关联网,还具有类聚、时许模式和检测偏差的作用。很多通过数据挖掘得到的信息都是出人意料的,但是往往是这些意想不到的信息将会开拓思维空间,对决策带来巨大帮助。
二、数据挖掘的广泛应用
数据挖掘在很多领域中广泛应用,特别是在市场经济的商业发展中已经相当成熟,它在很大程度上提高了企业的综合竞争力,到目前为止已经扩展到工业、医药业、电子商务行业等等。
1、数据挖掘在商业中的应用
数据挖掘在商业发展中扮演着重要角色,数据挖据相当于一个智能化筛选过程,它能够实现与信息技术的完美结合,为商业的发展提供重要帮助;例如在金融行业中,数据资料相对完整、精确,如今金融业中的数据挖掘技术已经十分成熟,企业能够充分利用该项技术,对市场的波动以及波动原因进行准确的分析,也能够通过数据挖掘形成科学、有效的预测机制,对企业的经营决策提供可靠依据;除此之外,金融企业还能够通过数据挖掘找出市场中的有效信息,对未来可能出现的风险进行评估,将企业的损失降到最低。又比如说在零售行业,数据挖掘能够为客户的划分提供准确的信息资料,并依据分类方法,对顾客的购买倾向和模式进行预测,这对于销售行业来说是至关重要的,同样根据相关信息,可以了解到顾客对商品价格和摆放的满意度通过不断调整,提高服务质量,满足消费者的不同要求。
1、数据挖掘在工业中的应用
数据挖掘在工业中的应用基本上可以分为以下几个方面,分别是在故障预测上、生产优化中以及丰富知识库中;首先,对于故障预测来说,数据挖掘是非常重要的一项环节,通过数据信息提供的资料,对故障发生的可能性进行准确预测,对于提高运行安全性,减少故障损失有至关重要的作用。其次对于生产优化来讲,数据挖掘能够为生产工艺的改进提供有效的信息,对于日后的生产工作有莫大的帮助。最后丰富知识库,数据挖掘本身就是一个信息收集、储存、调取的过程,企业能够从中获得任一有效的数据资料并加以保存,形成自身独特的文化底蕴,为决策的准确性、科学性贡献一份力量。
2、数据挖掘在医药业的应用
数据挖掘在医药行业的应用主要表现在科研方面,通过数据之间的联系研究,促进医学的快速发展;例如数据分析能够帮助医生找到病源,核定不同药物的不同疗效,实现药物的合理搭配,由于医学数据相对稳定,可以重复利用,因此对其准确性要求很大,通过数据分析找到最有效的治疗方案,对于医药界来讲是一大福音。
3、数据挖掘在电子商务业的应用
随着网络信息技术的发展,电子商务逐渐崛起成为后起之秀,同时很多网站也引入了数据挖掘技术,并从中开发出无限的商业价值。数据挖掘能够帮助商家提高用户体验的服务质量,对未来的消费趋势和市场走向进行合理预测,促使商家获得丰厚的经济效益。
三、数据挖掘的优化措施
1、决策树
这里所说的决策树是指利用信息论里包含的信息找出数据库中具有最大信息量的属性字段,建立一个结点,并根据这个属性字段的取值确定树的分支,并再各个分支中建立下层结点和分支,这种方法的最大优势在于,结果直观、清晰明了,容易理解;但是其缺点在于如果数据处理对象较为繁杂,就需要多重分支,使挖掘過程难于管理,极易出现错误。
2、遗传算法
这种方法以生物的进化过程为前提,这是生物学与计算机原理的完美结合,根据遗传学的相关知识,得出最合理的数据模型并加以优化;这种方法非常适用于数据类聚,充分利用时间类比和空间类比,可以将大量繁杂的数据资料转变成井然有条的数据资源,并从中探测数据之间紧密联系,最后得到有实用价值的模式;遗传算法具有高效性和灵活性的特点,它对数据的信息量要求不高,因此在数据挖掘中,它还适用于评定其他算法的适合度。
3、关联分析
关联分析就是从大量的数据库中搜索到对自己有用的关联信息,使依据数据之间的关联性开展的,目前,人们对关联分析的研究已经逐步深化,并提出了多种关联法则,比如说DHP、STEM等等,关联分析的最终目的是利用形成的数据关联网,为决策者提供有效的信息。
4、聚类分析
聚类分析是将一部分没有标定的记录作为输入集,以输入记录作为原始数据,暗战一定的规则,将记录进行合理的划分,并通过隐式或者显式的方式对划分类别加以具体描述。
四、结束语:科学技术的日新月异,使数据挖掘应用的领域越来越广泛,特别是在上文中所提到的几个行业中,数据挖掘扮演着举足轻重的角色;在未来的发展中数据挖掘依旧将会作为信息来源的重要渠道,帮助企业在激烈的市场竞争中获得有利地位。同时,数据挖掘也在发展中面临着些许挑战,本文中我们重点叙述了四种优化措施,分别是决策树、遗传算法、关联分析以及聚类分析,希望能够为数据挖掘的进一步发展带来帮助。
参考文献:
[1] 吴昉,宋培义. 数据挖掘的应用[J]. 贵州科学. 2012(03)
[2] 刘小华,胡学钢. 数据挖掘的应用综述[J]. 信息技术. 2009(09)
[3] 李江平,毕育学,颜虹. 数据挖掘技术在现场流行病学调查资料中的应用[J]. 中国初级卫生保健. 2011(08)
[4] 刘靖. 复杂数据类型的离群检测方法研究[D]. 华南理工大学 2014
关键词:数据挖掘;特点;应用;优化;
中图分类号:C37 文献标识码:A
二十一世纪是信息科学技术迅猛发展的时代,各行各业中有效数据的飞速增长,使人们处于海量的信息海洋中,为了进一步提高工作效率和市场竞争力,人们需要想尽一切办法对信息进行科学、准确的分析,并从中提炼出对未来发展或目前运营有利的信息资源;但是传统意义上的信息储存也好、信息检索也好既费时又费力,很难满足现代化经济发展的要求,而数据挖掘就是在这种经济环境中应运而生。
一、数据挖掘的基本概念
就目前来看,数据挖掘已经成为信息领域创新发展的重要内容,简单来看,数据挖掘就是从海量的数据信息中选择出对企业经营决策有关的直接信息或者潜在信息;之前出现的机器学习也好、统计学及模式识别也好,虽然在一定程度上能够帮助人们发现有效信息,但是其应用的范围很狭窄,大多是在科研领域,很难实现大面积的传播,数据挖掘的出现充分结合了上述几种方法的优势,实现了对信息进行精确、有效的整合。
从根本上来看,数据挖掘的本质目的就是从数据库模糊的、海量的、随机的的数据中检索出有使用价值的潜在信息资源;虽然数据挖据并没有明确搜索条件,但是它能够自动发现数据库中隐藏的预测趋势以及关联网,还具有类聚、时许模式和检测偏差的作用。很多通过数据挖掘得到的信息都是出人意料的,但是往往是这些意想不到的信息将会开拓思维空间,对决策带来巨大帮助。
二、数据挖掘的广泛应用
数据挖掘在很多领域中广泛应用,特别是在市场经济的商业发展中已经相当成熟,它在很大程度上提高了企业的综合竞争力,到目前为止已经扩展到工业、医药业、电子商务行业等等。
1、数据挖掘在商业中的应用
数据挖掘在商业发展中扮演着重要角色,数据挖据相当于一个智能化筛选过程,它能够实现与信息技术的完美结合,为商业的发展提供重要帮助;例如在金融行业中,数据资料相对完整、精确,如今金融业中的数据挖掘技术已经十分成熟,企业能够充分利用该项技术,对市场的波动以及波动原因进行准确的分析,也能够通过数据挖掘形成科学、有效的预测机制,对企业的经营决策提供可靠依据;除此之外,金融企业还能够通过数据挖掘找出市场中的有效信息,对未来可能出现的风险进行评估,将企业的损失降到最低。又比如说在零售行业,数据挖掘能够为客户的划分提供准确的信息资料,并依据分类方法,对顾客的购买倾向和模式进行预测,这对于销售行业来说是至关重要的,同样根据相关信息,可以了解到顾客对商品价格和摆放的满意度通过不断调整,提高服务质量,满足消费者的不同要求。
1、数据挖掘在工业中的应用
数据挖掘在工业中的应用基本上可以分为以下几个方面,分别是在故障预测上、生产优化中以及丰富知识库中;首先,对于故障预测来说,数据挖掘是非常重要的一项环节,通过数据信息提供的资料,对故障发生的可能性进行准确预测,对于提高运行安全性,减少故障损失有至关重要的作用。其次对于生产优化来讲,数据挖掘能够为生产工艺的改进提供有效的信息,对于日后的生产工作有莫大的帮助。最后丰富知识库,数据挖掘本身就是一个信息收集、储存、调取的过程,企业能够从中获得任一有效的数据资料并加以保存,形成自身独特的文化底蕴,为决策的准确性、科学性贡献一份力量。
2、数据挖掘在医药业的应用
数据挖掘在医药行业的应用主要表现在科研方面,通过数据之间的联系研究,促进医学的快速发展;例如数据分析能够帮助医生找到病源,核定不同药物的不同疗效,实现药物的合理搭配,由于医学数据相对稳定,可以重复利用,因此对其准确性要求很大,通过数据分析找到最有效的治疗方案,对于医药界来讲是一大福音。
3、数据挖掘在电子商务业的应用
随着网络信息技术的发展,电子商务逐渐崛起成为后起之秀,同时很多网站也引入了数据挖掘技术,并从中开发出无限的商业价值。数据挖掘能够帮助商家提高用户体验的服务质量,对未来的消费趋势和市场走向进行合理预测,促使商家获得丰厚的经济效益。
三、数据挖掘的优化措施
1、决策树
这里所说的决策树是指利用信息论里包含的信息找出数据库中具有最大信息量的属性字段,建立一个结点,并根据这个属性字段的取值确定树的分支,并再各个分支中建立下层结点和分支,这种方法的最大优势在于,结果直观、清晰明了,容易理解;但是其缺点在于如果数据处理对象较为繁杂,就需要多重分支,使挖掘過程难于管理,极易出现错误。
2、遗传算法
这种方法以生物的进化过程为前提,这是生物学与计算机原理的完美结合,根据遗传学的相关知识,得出最合理的数据模型并加以优化;这种方法非常适用于数据类聚,充分利用时间类比和空间类比,可以将大量繁杂的数据资料转变成井然有条的数据资源,并从中探测数据之间紧密联系,最后得到有实用价值的模式;遗传算法具有高效性和灵活性的特点,它对数据的信息量要求不高,因此在数据挖掘中,它还适用于评定其他算法的适合度。
3、关联分析
关联分析就是从大量的数据库中搜索到对自己有用的关联信息,使依据数据之间的关联性开展的,目前,人们对关联分析的研究已经逐步深化,并提出了多种关联法则,比如说DHP、STEM等等,关联分析的最终目的是利用形成的数据关联网,为决策者提供有效的信息。
4、聚类分析
聚类分析是将一部分没有标定的记录作为输入集,以输入记录作为原始数据,暗战一定的规则,将记录进行合理的划分,并通过隐式或者显式的方式对划分类别加以具体描述。
四、结束语:科学技术的日新月异,使数据挖掘应用的领域越来越广泛,特别是在上文中所提到的几个行业中,数据挖掘扮演着举足轻重的角色;在未来的发展中数据挖掘依旧将会作为信息来源的重要渠道,帮助企业在激烈的市场竞争中获得有利地位。同时,数据挖掘也在发展中面临着些许挑战,本文中我们重点叙述了四种优化措施,分别是决策树、遗传算法、关联分析以及聚类分析,希望能够为数据挖掘的进一步发展带来帮助。
参考文献:
[1] 吴昉,宋培义. 数据挖掘的应用[J]. 贵州科学. 2012(03)
[2] 刘小华,胡学钢. 数据挖掘的应用综述[J]. 信息技术. 2009(09)
[3] 李江平,毕育学,颜虹. 数据挖掘技术在现场流行病学调查资料中的应用[J]. 中国初级卫生保健. 2011(08)
[4] 刘靖. 复杂数据类型的离群检测方法研究[D]. 华南理工大学 2014