论文部分内容阅读
数据挖掘技术是目前在全球范围内重点投资研究的一项重大新技术,也是在数据库系统的研究和应用领域的一个热点。面对当前移动通信领域市场竞争的不断加剧,国内三大运营商已开始筹划建立“以客户为中心”的经营管理模式。因此,利用数据挖掘技术对企业的海量客户数据进行挖掘分析,从中发现各种潜在的、有价值的商业规律或者验证已知的商业预测,是当前各大运营商提高自身竞争力的重要手段之一,极具理论意义和应用价值。本文以数据挖掘技术在移动增值业务中的应用为主题,针对某运营商扩大业务用户群、实现精确营销的迫切需求,深入阐述了如何通过对客户特征数据进行分析,建立潜在客户预测系统,并将其应用于扩大业务用户群的预测中。首先,介绍了数据挖掘的理论及相关算法,其中对决策树算法和回归算法作了较为细致的分析和探讨。其次,从运营商的实际情况出发,结合电信行业的经营状况、经营分析系统的建设现状,分析探讨了运用数据挖掘的重要性,以及数据挖掘技术在该行业的应用现状。同时针对本文的研究对象,即某移动运营商近三年着力推广的移动增值业务—飞信,结合其业务状况、客户情况等方面的研究,着重分析了飞信业务的发展状况、现阶段存在的推广难题及飞信业务的用户特征。然后,概要描述了某移动运营商的数据业务经营分析系统扩建项目的背景和建设需求,并根据其实际需求,给出本文所讨论的潜在客户预测系统的基本描述,对预测系统的功能及应用范围作了详细阐述。最后,针对笔者所负责的飞信业务潜在客户预测系统的设计及实现工作,详尽论述了其设计思路和实现方案。以特殊到一般的推导分析方法作为基础,以CRISP-DM(Cross-Industry Standard Process forData Mining,跨行业数据挖掘过程)为基本框架,按照商业理解(BusinessUnderstanding)、数据准备及预处理(Data Preparation)、模型建立(Modeling)、模型评估(Evaluation)、前端展现(Deployment)的步骤,借助数据挖掘工具Clementine,最终建立了飞信业务潜在客户预测系统。在建模过程中,充分利用了C5.0决策树算法、CART算法及Logistic回归算法的优势,有效的提高了分类精度,并保证了模型的稳定性,实现了将预测系统应用于飞信业务潜在客户识别的目标。本文以实际的项目为依托,完成了将数据挖掘技术应用于移动通信领域商业预测、并指导营销决策的任务,体现了巨大的商业应用价值。应用结果表明,所建立的预测模型是科学的、基本上符合实际情况的,能够给决策人员提供必要的智能化信息支持的,该预测模型对解决潜在客户预测方面的问题具有重要意义。