论文部分内容阅读
企业之间已开始从基于产品的竞争扩展到基于客户的竞争,而且伴随着供应链管理的产生与发展,供应链的不断延伸,对最终客户管理的要求越来越细化,越来越重要。客户信息正逐渐成为企业最重要的资源之一,有效管理客户资源已成为企业的迫切需求,客户关系管理(Customer Relationship Management)由此应运而生。本文基于数据仓库技术构建CRM系统的课题为背景,详细讨论了构建保险行业CRM应用系统所采用的技术、开发步骤、技术难点和实现方法。 客户关系管理在保险行业应用越来越广泛,同时保险行业也利用数据仓库技术提高信息化水平,通过数据仓库来管理和运用好自己的数据,建立决策支持系统,从而增强企业的竞争力。保险行业的原始业务数据频繁变更,对数据仓库的性能提出了很高的要求,因此在实现保险行业基于数据仓库的客户关系管理系统过程中有很多的困难。 本文首先概要介绍了CRM的产生背景、系统组成、发展现状、保险业发展对CRM的应用需求及作者在项目中所做的工作。其次论文介绍了客户关系管理、数据仓库和联机分析处理的概念与特点,然后重点介绍了构建MTU-MENULIFE CRM的各个组成部分和其构建技术。本论文以Oracle数据仓库和数据库为主要开发平台,以Brio Explorer为主要的数据展示工具,以中宏保险OLTP的Oracle为数据源,结合中宏保险现有的系统,围绕MTU-MENULIFE CRM的主要技术问题进行了探讨和研究。 ETL的工作量在数据仓库系统构建过程中占相当的一部分,因此本文用较大的篇幅介绍了ETL的实现过程,同时还提出了一种利用关联规则进行保险合同核保的方法:首先通过机器学习的方法得到关联规则的置信度和支持度,再在一定的支持度下利用置信度来检验保险合同的风险,也就是从过去的赔付数据中寻找出规律,并将其作为新单的核保指导。另外本文还结合系统构建过程介绍了本系统在数据仓库优化方面所作的一些尝试。 客户数据质量的好坏直接影响到客户关系管理系统的成败,因此本文介绍了一种常规的在数据仓库实现数据清洗的方法,提出了一种利用相邻数据排序的方法来清洗重复客户数据的经典算法,该算法通过预处理技术,聚合相关数据,通过减少数据匹配次数来改善重复数据监测清洗的性能,但这个算法提供数据匹配方法是基于英文书写习惯的,本文通过改进提出了一种基于中文缩写习惯的数据匹配算法。最后本文对经典清洗重复客户数据的算法提出了两点改进。1,采用增加一次窗口扫描,而减少窗口宽度。2,采用多关键字匹配、相似性传递的扫描匹配。实践证明这两种改进算法在大样本下可以明显改进清洗重复客户数据的匹配效率,大大减少匹配时间。这个算法不仅可以检测重复客户数据,而且可应用于检测保险欺诈行为,对于规避保险公司风险,提高保险公司客户服务效率有很大的作用,同时本算法也完全可以应用到银行信贷等其他领域。