论文部分内容阅读
在国家政策扶持下,中国保险行业经历了快速发展,保险密度从1980年的0.46元/人增加到2008年的736.74元/人。虽然发展较快,但道路很不平坦,与我国经济发展水平也不相适应。改革和重组,导致了国内保险市场环境发生了根本性的变化,改变了个别保险企业垄断市场格局,形成了以数家较大的保险企业为主导、多家小保险企业参与、新保险企业不断加入的新格局。加之国内保险行业的赢利能力与经营管理能力远落后于发达国家,开放进程的加快更是加大了国内保险企业经营与生存压力。因此,既快又好地发展中国保险事业,支持经济发展、构建和谐社会,成为政府、产业与学术界共同关心的课题。通过对国外保险行业数据挖掘技术理论与应用的综述与研究分析,结合国内保险行业经营管理与信息化水平,本文提出了数据挖掘技术在国内保险行业中的应用。通过理论研究与实证研究分析,本文得出了数据挖掘技术在国内保险行业应用具有可行性与必要性。研究与实验结论体现为以下两个方面:(一)数据挖掘技术在保险行业中的应用领域。(1)客户关系管理。数据挖掘技术在客户关系客管中的应用主要集中于客户服务分析与客户信用评估。客户服务挖掘主要是通过对客户咨询与投诉进行行为分析,根据咨询信息与投诉建议,找出这类客户的基本特征,开展针对性客户服务。客户信用评估主要是通过数据挖掘分析,提取出客户信用等级信息与相对应的客户特征,根据不同信用等级客户所具备的特征,提供相应的服务或监控。由于客户关系管理是一个相当泛化的概念,本文把CRM仅定位客户服务与客户信用评级。(2)目标客户识别。目标客户识别的三种方法:调查问卷法、统计分析、数据挖掘法。通过比较三种方法的优劣,指出数据挖掘技术在海量数据集与高维空间中识别目标客户的优势。(3)保单交叉销售。通过数据挖掘可以提取出购买多种保险产品组合的客户特征与行为特征,为保险营销提供指导。(4)客户保持与流失分析。采用数据挖掘技术,提取已流失客户的特征,建立客户流失模型,并应用模型来预测已有客户流失的概率,以便针对性地改善服务或调整产品结构。(5)保险客户欺诈分析。本文所指的保险欺诈是单方欺诈,即保险客户对保险企业的不当行为。相较于统计分析,数据挖掘技术在处理小概率事件具有明显优势。通过数据挖掘方法对海量高维数据处理,提取出欺诈客户的基本特征,建立欺诈预警模型,实时监控与评估保险客户的欺诈风险。(二)数据挖掘技术在保险行业中的实证分析。(1)数据挖掘技术的基本特征与功能,以及主流的数据挖掘算法。(2)数据挖掘系统的体系结构, SAS EM4.3的数据挖掘功能,以及选取数据挖掘工具的基本原则。(3)数据挖掘技术在保险行业中应用的一般流程与数据挖掘标准CRISP-DM。(4)针对“保单购买预测”数据挖掘主题进行了实证研究分析。内容包括:数据准备过程、指标筛选方法、数据挖掘方法选择、模型效率评价以及模型部署所需注意的事项等。阐述了实验算法:决策树算法、神经网络算法以及Logistic回归分析的基本原理。比较了统计方法与数据挖掘方法。指出了各算法的适用性、优势与缺陷,以及对数据的要求。(5)基于SAS EM4.3与MatLab2007的数据挖掘实践。从应用层面,详列数据挖掘工具的应用过程,包括对关键程序代码的解释。分析了数据挖掘模型如何嵌入到其它的信息管理系统,以使其能自我学习与更新,提升预测分析能力。