可拓数据挖掘方法及其应用研究

来源 :东华大学 | 被引量 : 10次 | 上传用户:cpu1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的迅速发展以及数据库管理系统的广泛应用,使得人们积累的数据远远超过人们分析和理解数据的能力。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更深层次的分析,以便更好地应用数据和提供决策支持。数据挖掘技术为了解决“数据爆炸但知识贫乏”的问题便应运而生。成为目前具有挑战意义的研究热点之一。数据挖掘就是从大量的、不完全的、冗余的、有噪声的数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的信息和知识的过程。随着经济全球化的推进,环境的多变促使了信息和知识的更新周期缩短,创新和解决矛盾问题越来越成为各行各业的重要工作。因此,如何挖掘变化的知识就成为数据挖掘研究的重要任务。可拓数据挖掘是可拓学和数据挖掘结合的产物,它探讨利用可拓学方法和数据挖掘技术,去挖掘数据库中与可拓变换有关的知识,包括可拓预测知识、可拓分类知识、可拓关联规则和传导知识等可拓知识。在全面综述国内外现有可拓数据挖掘方法的基础上,从方法到应用对可拓数据挖掘关键技术进行了深入的研究,综合运用可拓学理论、粗糙集理论、模糊理论、集对分析等其它数据挖掘方法,寻找出一种行之有效的创新模型化方法,即可拓数据挖掘模型与方法,主要研究成果如下:(1)基于可拓聚类的预测方法研究传统的预测方法往往受样本数目的限制,而且对于指标的变化不能准确的、定量的描述,针对传统预测方法的复杂性,结合可拓学和聚类方法,建立可拓聚类预测模型,首先通过系统聚类的方法,对相近的属性聚类,以达到属性约简,然后对余下的各属性变化率进行可拓聚类,采用比重权数法和主观经验来确定权重系数,来进行可拓聚类预测。最后以中国联通2002-2008年的相关指标,来预测企业另外某个指标的量值。对2008年的某个指标进行可拓聚类预测,预测结果和中国联通2008年公布的年报中某个指标的数值是完全相符的,说明利用可拓聚类预测方法进行预测是可行的。其分析结果对于中国联通战略的制定有一定的参考意义。(2)基于可拓的客户繁衍价值研究与应用当前客户价值评价侧重于静态的描述,缺乏动态的研究,特别是基于口碑效应的潜在价值的定量研究,针对当前客户价值评价的缺陷和难以描述定量定性相结合的不足,结合可拓学和客户价值理论,用共轭分析方法,细分客户价值,提出了基于可拓的客户繁衍价值,通过定性和定量的方法,建立基于可拓的客户繁衍价值模型。最后针对中国联通近期推出的推荐有奖,入网有礼活动,定量计算客户的繁衍价值,其分析结果对于中国联通销售策略的制定具有一定的参考意义,对其他企业的营销策略、口碑和形象宣传也具有一定的参考意义。(3)基于粗糙集的可拓数据挖掘及其在企业品牌细分中的应用针对当前数据挖掘属性约简和权值系数确定的复杂性和主观性,结合可拓学和粗糙集方法,建立企业品牌细分模型,首先通过粗糙集联系度的方法,对属性进行约简;再利用粗糙集方法和相关经验确定各属性的权值系数,对企业品牌进行细分。最后通过对中国联通现有的三大品牌相关指标分析,并提出品牌整合建议,能对新客户的入网提供适宜的差异化服务。其研究结果对企业的客户关系管理具有一定的工程实践意义。(4)基于可拓的关联规则研究及其应用关联规则的有效性是随时间发生动态改变的,针对当前关联规则挖掘的静态性,结合可拓学和关联规则方法,首先分析可拓变化引起的正质变域、负质变域、正量变域、负量变域和拓界,对关联规则的前后件分别进行正可拓变换、负可拓变换、正稳定变换、负稳定变换和拓界变换,然后给出可能的可拓关联规则,着力分析正可拓变换情况和负可拓变换情况,并给出相应的支持度和可信度。最后对中国联通新套餐推出前后的指标变化进行分析,着重分析其正负可拓变换,针对不同类型的客户,给出可行的套餐建议。结果说明基于可拓的关联规则是有效的。其分析结果对于中国联通销售策略的制定具有一定的工程实践意义。最后进行了概括性总结,并提出了有待进一步研究的方向。研究成果对于中国联通乃至其他企业的战略决策、客户关系管理、营销策略、形象宣传具有一定的理论意义和工程实践意义。
其他文献
中国是历史上佛教美术作品保留较多的一个国家,从方式和形态上,基本上没有什么变化,本学生来到中国之后学到了很多知识,和韩国做了很多比较。自然而然也想对中国和韩国的佛教
专业化和多元化是企业的两种成长战略。选择专业化还是多元化战略是任何一个企业都应该考虑的问题。专业化好还是多元化好,对这个问题的回答一直很有争议。本文认为这两种战
5G技术具有大带宽、低延时、容量大的特征,是以后移动通信发展的主攻方向,能够广泛应用在警务工作的各方面。本文对5G通信的相关关键技术进行了讲述,并结合公安工作特点构建