基于数据挖掘的银行电话精准营销

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:madiawang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据时代的到来和数据挖掘技术的广泛应用,银行金融产品不再是以前单一的、广泛式的撒网销售,而是依托于大数据的智能分析和算法的准确判断,进行多样化的精准营销。电话营销作为银行业传统的营销方式,在获取客户方面是行之有效的。传统的银行电话营销方式由于随机性、低命中率,难以满足时代发展的需求。如何利用好银行数据库中的各种数据,进行科学有效的电话营销,是实现银行数字化、网点智能化的关键所在。本文的研究对象是预测银行电话营销的结果,由于行业特点,银行客户数据集是不平衡的。目前的银行电话营销研究大多集中在提升模型效果上,虽然模型预测结果都不错,但由于模型训练选取的数据集多为平衡数据集,改变了数据集原有的分布,且仅凭一两个指标便选出最优模型,不够全面,与实际应用有所偏差。因此,本课题从数据层面出发,结合数据集的分布,利用数据挖掘工具,综合考虑多个评价指标,研究不平衡数据集的各种采样策略对模型效果的影响,对比得到最佳采样策略,寻找最佳采样策略下的最佳模型,以此来提高模型预测的效果和营销成功率,实现精准营销。最后,对预测错误的样本进行了统计分析,并根据预测结果进行客群分类,挖掘潜在客户具有的特征,从增加银行收益和降低获客成本两个方面,为银行电话营销提供切实有效的建议。本文实验数据集选自UCI网站的葡萄牙银行数据集,共有41188条,正负比例为1:7.8。我们按照8:2的比例将数据集划分为训练集和测试集,利用ENN、Borderline-SMOTE、SMOTE+ENN和本文提出的TS采样等方式对训练集采样,接着用逻辑回归、决策树、XGBoost、Light GBM等分类模型对采样数据训练。通过综合分析F1值、KS值、AUC值等评价指标发现,ENN采样在各个模型上的综合效果最好,且ENN采样下的Light GBM模型预测效果最佳。本文提出的TS采样效果不明显,经分析,主要原因是采样过程中样本信息重复利用,容易过拟合。另外,通过ENN客群分类发现,潜在客户的特征和营销成功客户的特征十分相似,主要表现在以下方面:年龄在31岁到50岁的中青年;具有高中及以上的学历;工作较为稳定,比如技术员、管理员等职业;婚姻状况稳定的结婚人士;无不良记录,比如违约贷款,房贷;比较青睐于cellular这种联系方式等特点。
其他文献
疗养院是运用疗养医学理论和技术促进伤病康复的医疗保健机构,其护理技术管理在内容形式、方式方法与医院有明显不同,有其自身特点和规律。而疗养院供应室作为重要灭菌场所与
在科技不断发展的背景下,我国迎来了大数据时代。对于医院来讲,包含的资料较多,这就需要使用合理的管理模式,在最快的时间内对资料进行处理,提升工作效率。而财务管理在医院
印刷线路板(PCB)作为一种电子基础材料,广泛存在于各种电子设备中,其质量对电子产品的整体质量具有重大影响。在PCB的大批量生产过程中,由于PCB的层数多、布线密集,再加上一
随着社会经济文明的发展使得社会关系网交织越发密集与复杂,随之大众日益增长的权利意识要求法律能够与时俱进地保护自身权益,其中人们对自身人格权的关注也愈演愈烈。而一般人格权作为人格权体系中的核心内容,在没有具体人格权条款或具体人格权条款不足以保护当事人权益的情况下,亟需对一般人格权条款进行解释并予以适用。故如何对其进行解释与适用使其切实发挥在人格权领域的独特功能并更好的融入我国民法制度中,确有研究的必
文章从科技专项审计的角度出发,指出了当前科技项目经费管理中存在的问题,包括项目预算不合理、经费预算执行和监管不到位、外拨经费使用效率不高、配套资金不到位、项目结余
随着人民生活水平的提高,高血压、心脏病、糖尿病成为老年人的高发病症。与此同时,气候变化、环境恶化导致的恶性肿瘤在老年人中的发病率也日趋增高。另外,
在研究杭州园林植物景观形成原因的基础上,分析杭州园林植物景观的地域性的种类特征、季相特征、文化特征,总结杭州园林绿地植物景观地域性特点,提出杭州园林植物地域性景观
近几年我国的医疗改革在不断推进,医院传统的党建工作模式已经跟不上医疗改革的步伐,建党工作出现了创新活力不足、流于表面、与中心工作脱节等一系列现象。人本管理就是以人
目的通过对疗案首页缺陷情况进行分析,提出改进措施,提高疗案整体质量。方法利用"疗养首页上报查询子系统",对我院2008—2011年5614份出院疗案进行质量监控。结果疗养员基本信