【摘 要】
:
海量数据的存在,从海量数据中提取信息的应用需求,以及信息对企业战略决策的影响,使得数据挖掘无论是理论研究还是应用实践都是有意义的。本文研究了数据挖掘技术在客户关系
论文部分内容阅读
海量数据的存在,从海量数据中提取信息的应用需求,以及信息对企业战略决策的影响,使得数据挖掘无论是理论研究还是应用实践都是有意义的。本文研究了数据挖掘技术在客户关系管理(CRM)中的应用。 关联规则在数据挖掘中是一个重要的研究领域,它具有通俗易懂、可理解性强、简洁性好、应用范围广等优点,主要任务是发现大量数据中项集之间的关联或相关关系。频繁项集的发现是产生关联规则的最为关键的一步,主要的方法是采用Apriori算法来寻找频繁项集,但是该算法的时间效率有待提高。 由于最大频繁项目集中已经隐含了所有频繁项目集,CRM中某些数据挖掘应用仅需要发现最大频繁项集,所以研究最大频繁项集的挖掘具有重要价值。本文针对CRM系统中数据的特点,提出了一个挖掘最大频繁项集的算法—MFIA_VTL算法。该算法采用垂直事务标识列表(Vertical Tid-List,VTL)结构的数据库表示形式,按照自底向上深度优先的策略对项集空间进行搜索,采用基于前缀的搜索空间划分技术,将搜索空间划分为较小的子空间,每个子空间就是一个潜在的最大频繁集,这样发现最大频繁项集的工作即在一个尽可能小的、包含最大频繁集的超集上进行,因此将明显降低I/O开销。VTL结构的数据库表示形式使得项集的支持度计算可以通过简单的集合交集运算来完成,从而避免了对数据库的多次扫描。实验分析表明,MFIA_VTL算法性能稳定,可扩展性好,效率高。
其他文献
半虚拟化与单根输入输出虚拟化(Single-Root I/O Virtualization,SR-IOV)是目前主流的I/O虚拟化方式。SR-IOV支持对设备的原生共享,具有很好的I/O性能,但其受硬件限制仅能支持有限
现代企业生产经营活动中包含了各式各样的业务流程,可以说一个企业的生产经营活动就是由各式各样的流程组成的,因此业务流程和企业的生产经营是息息相关的。对业务流程进行建
本文研究Multi-Agent系统,众所周知,Multi-Agent系统及分布式人工智能已经成为当今人工智能领域研究的重点。Muli-Agent的基本问题是智能体之间的协调,可细分为单智能体设计、多
随着数据挖掘技术在商业、保险业等方面的广泛应用,从大型的数据库中高效地挖掘频繁模式是目前数据挖掘领域的主要研究内容。虽然,在过去的十几年间,提出了许多高效的频繁模式挖
工作流技术是近年来在计算机应用领域中发展最为迅速的新技术之一,是一种在办公自动化应用和企业经营活动中得到充分利用的先进的流程控制技术。工作流技术的主要特点是:过程
随着湖南省国税系统的全省征管业务数据的逐渐全面集中,使得利用计算机进行全面的税收监控、辅助领导进行决策管理成为可能。邵阳市国税局信息中心在省局的领导下,开发了税收监
分布式应用程序为了降低模块相互之间的耦合程度以及更好的应对可扩展、可操作性的要求,通常引入消息队列来降低模块之间的耦合和平衡各模块处理能力,消息队列允许分布式系统模
随着计算机技术的发展和越来越广泛的应用,人们对计算机的依赖程度也越来越高。计算机的可靠性和可用性也变得越来越重要了。尽管单台计算机的性能和可靠性越来越好,但还是有
随着科学技术的进步,计算机科学已经渗透到人们生活中的各个领域,人类对计算机网络的需求越来越强烈。Internet的诞生,使分布在世界上数以千计的网络互联起来。但是各类硬件、软
作为保证软件质量、提高软件可靠性的重要手段,软件测试在软件开发过程中起着不可替代的作用,而测试数据生成则是测试阶段最关键的技术问题之一。目前已有许多测试数据自动生成