基于泰康飞铁保保险用户数据的分析与研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xiehao2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究工作的重点在于对泰康人寿保险公司拥有的大量用户数据进行深度分析,利用机器学习的方法进行市场需求预测,以及业务推荐。在没有引入数据分析解决该问题之前,由于用户信息无法直接判断用户价值的高低,因此传统方式是以对用户进行访问调查的方式人为判断用户的价值,这种方式及其耗费人力、物力,并且效率低下。所以通过用户数据来定位客户价值,并且有针对性的对用户进行保险推荐服务,是保险公司急需解决的问题。而本文研究内容是解决这个问题的重要技术手段。该工程通过对客户的属性信息或行为信息进行自主学习,使泰康人寿保险公司能够快速定位用户需求,占领市场份额。  经过对保险用户数据集的处理、分析和研究,根据保险公司的需求,针对高价值用户的寻找问题和保险产品的推荐服务,本文在此数据集上做了以下三个方面的研究工作:  第一,设计一种适合保险公司需求的分类模型来寻找高价值用户。在对用户数据进行处理后,把数据做归一化处理,可以加快模型的收敛速度,然后调节平衡参数来获得最优的SVM高斯核模型,并通过和其他分类模型的对比实验,来说明所得到的模型是最适合保险数据集的分类模型。通过此模型可以找到高价值用户从而让保险公司有针对性的进行营销服务。  第二,设计使用Kmeans聚类的方式给没有购买记录的用户推荐保险产品。由于有些用户没有过保险购买记录,所以我们没有办法根据他对某个保险产品的偏好来对其进行保险产品的推荐。针对这个问题,本文提出使用Kmeans聚类的方式把所有用户聚集到K个类,然后根据用户所属分类中的保险购买情况来给用户推荐购买热度高的保险产品。经过试验得到了较好的推荐效果。  第三,设计使用协同过滤算法的方式来给有购买记录的用户推荐保险产品,并且把协同过滤算法移植到Spark平台,实现了分布式的协同过滤算法。借助协同过滤算法的思想,应用于保险用户数据集来实现保险产品的推荐服务。由于保险公司的数据集是非常大的,而单机模式下的协同过滤算法计算时间过长,不能满足保险公司对保险推荐的实时需求,所以在此基础上把协同过滤算法移植到Spark平台,实现分布式的方式来减少计算时耗。经过试验表明,在Spark上的协同过滤算法可以在保证推荐精度的情况下可以很大程度上减少计算时耗。  经过对该工程的测试、试用,所设计的模型能够快速定位到高价值用户,并且使用的推荐模型能够获得较好的推荐效果。该工程可以扩展到对各行业历史数据分析以及业务预测。具有较高的应用价值。
其他文献
随着网络技术的发展,大量的电子文档在互联网上流动,这就涉及到电子文档的版权和完整性的保护问题。针对这类问题,数字水印技术是避免因文档被恶意篡改造成损失的一种有效、可靠
随着地理信息产业化、数字化信息步伐的加快,计算机技术的飞速发展,地理信息系统的应用已深入到各行各业。地理信息系统具有对空间数据、空间信息强大的分析管理的能力,十分
随着网络技术和国际国内形势的发展变化,为应对公共突发事件和反恐工作的需要,国务院要求各市建立公共突发事件应急指挥中心,公安部要求各市必须建立反恐指挥中心。因此,建设
作为近年来的热点研究问题,视线估计的重要意义逐渐被越来越多的人们意识到,同时它也是本课题组多年来的主要研究方向。脸部特征提取作为视线估计系统中的重要组成部分是本文
随着计算机网络技术的普及,信息安全问题日益严峻,已引起人们广泛的关注。入侵检测作为一项具有实时发现黑客攻击模式的技术已经成为保障网络安全的重要手段之一。而将数据挖掘
随着高职学院教务改革的发展,由传统的学年制向学分制转变,为了适应这种变革并提高高职学院教务管理部门的管理质量和水平,采用比较先进的科学的综合教务管理系统来进行管理成为
非税收入是政府财政收入的重要组成部分,是政府参与国民收入分配和再分配的一种形式。根据国家财政管理改革的要求,各地财政进行了大幅的财政管理改革。非税收入收缴管理实行“
随着计算机网络和多媒体技术的迅猛发展,数字媒体(数字图像、视频、音频等)很容易借助因特网等媒介被复制、传播、处理和公开,这使得人们对数字媒体的完整性、内容的真实性产
科学研究是除教学之外高校的一项重要基本功能,也是高校教学等其它职能得以充分发挥的基础,同时科学研究的能力也是影响高校学科结构、师资水平、培养质量以及高学历培养最重要
随着现在信息化的发展,计算机已经应用到校园的各个部门。教务管理在学校也占据了十分重要的地位,使用现代化的教学管理手段来提高质量是未来发展的一种必然趋势。本教务管理