论文部分内容阅读
CRM和数据挖掘是目前计算机技术领域两个非常热门的话题。CRM是企业信息化的重要
内容,它在电子商务中所起到的日益重要的作用,使其受到企业越来越多的重视。数据挖掘
是知识发现中的一个有力工具,随着人们对其理论日益广泛、深入的研究,其研究成果在实
际问题中的系统应用必将越来越广泛、具体和深入。数据挖掘技术为我们从大量数据中找到
有用的“知识”提供了强有力的技术支持和手段,利用数据挖掘技术,设计和开发具有分析
功能的CRM系统,已经成为业界的共识。
论文对CRM和数据挖掘的有关基本理论进行了综合的分析和阐述,在对现有理论进行
深入的理解和分析的基础上,指出了部分现有理论和算法中存在的不足并做了补充与改进。
论文的主要工作体现在:
◇ 针对关联规则挖掘中只用支持度和置信度作为度量指标,来判断所得规则是
否为强关联规则,对于Web数据来说缺乏时效性这一问题,首次提出了增加
“时效性”作为关联规则用于Web数据挖掘时,衡量规则是否为强关联规则
的度量指标,使得规则的时效性得到了体现和加强;
◇ 针对k-means算法预先对最终聚类类别数目进行确定这一不足,对k-means
算法进行了改进,论文提出了改进的k-means算法,称之为X-means算法,
并设计、实现了X-means算法。该算法克服了k-means算法事先确定最终聚
类数目的限制,使得聚类的最终数目根据实际情况,按照算法进行聚类。
◇ 根据CRM系统功能的实际应用需要,设计并实现了一种Email数据挖掘的相
关模型与算法。
◇ 设计并开发、实现了一个实用的数据合并工具。
这些成果均在实际应用中发挥了作用。此外,本文还利用对数据挖掘理论研究的
实际成果,实现了包括发现重要客户、发现潜在客户、预测即将流失的客户和为客户
提供个性化服务等CRM系统的几个重要的功能。
最后,本文在总结与展望中提出了开发Web内容挖掘应用于CRM系统,将数据挖
掘技术与CRM有机结合,进一步完善其功能的研究方向。
关键字:CRM、数据挖掘、知识发现、Web挖掘、关联规则挖掘、时效性、聚类分析、分类、
决策树、X-means算法、Email数据挖掘、数据合并工具