基于通话行为数据的个人信用风险预测

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:O70607227
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通信行业作为国家信息化建设的基石,在我国市场经济中发挥着至关重要的作用。近年来通信行业迅猛发展,5G建设稳步推进,通信服务业无论在营收额还是人口覆盖率上都达到了空前的规模,而与此同时三大运营商却仍普遍存在客户信用损失带来的高额财务危机。因此如何对通信用户进行科学有效的管理,防范信用损失风险,是通信运营商缩减营销成本、降低欠费和坏账风险、提升用户保有量以及满意度的关键之所在。信用损失问题在传统金融领域早已广泛存在,欧美发达国家率先引领征信行业的发展,我国征信行业起步较晚,迄今为止,我国个人征信业务也主要围绕银行、保险、P2P等金融机构展开,通信行业的个人征信几乎一片空白,而传统金融领域的征信业务虽然对通信行业的信用问题有一定的借鉴意义,但无法完全用来评估通信用户的信用。近10年各行各业的大数据都呈现井喷式的增长,移动通信运营商更是有着其得天独厚的优势掌握着用户海量的通信数据,因此也成为了数据挖掘领域的研究热点,但大多数学者或机构的研究聚焦在其用户数据能否解决金融领域的个人信用问题,对用户数据的分析较多地围绕用户的基本信息、账单金额、履约情况、入网时长、通话次数等特征,迄今尚没有工作全面深入地分析用户通话数据对其通话信用的揭示作用。因此,本文基于用户通话数据,对其行为模式的特点进行挖掘,并采用有监督学习的方法,对其通话行为特点与信用之间建立联系并提出信用风险预测模型,丰富了现有通信行业的信用评估体系。本文使用中国移动浙江公司与浙江大数据交易中心联合主办的Data Tech2017大赛公开的数据集,研究6863名用户在32天观察周期的通话行为模式,总通话记录达到143万多条,守信用户与违约用户的数量接近1:1。本文基于对数据的观察和描述,从活跃性、多样性、规律性三大维度提取了22个通话行为特征,主要有:反应用户活跃性的通话缺失的天数、不同通话类型的(日均)通话次数、通话对象数,反应用户多样性的(日均)通话熵、通话时长档级熵,以及反应用户规律性的每日/周通话对象数量方差、工作日/周末通话数量/通话对象数量差、通话对象集中度、周呼叫规律性。文中对提取的特征给出了详细的计算公式,同时对特征结果进行可视化展示,详细说明了该特征在两类用户通话行为模式上能够区分彼此的特点。对所有的特征进一步加入相关性分析以及显著性检验,验证本文基于通话数据提取特征的有效性。最后本文对提取的所有特征,分别采用机器学习、深度学习、集成模型的分类算法,构建了7种信用风险预测模型,发现各模型在不同的衡量指标上都取得了较好的表现,进一步证明了本文所提出的通话行为特征提取方法对于用户信用水平预测的有效性。同时本文选取了其中一种均衡表现较为优异的模型,通过消融实验分别对活跃性、多样性、规律性三大类特征进行比对,发现活跃性特征较其他两类特征能够更好地揭示用户的信用水平,而聚合三大类别的特征共同建模,能够融合多方面的信息,更加提升模型的预测能力。
其他文献
医疗众包模式是在政策、经济和技术三大背景下发展而来的、将传统的医疗结合新兴的互联网技术而发展起来的一种医疗模式。这一模式可以打破地域限制,将不同地区、不同供需、不同层次的医疗资源重新整合,实现互联互通的新型医疗体系。医疗众包模式是一种新的辅助传统医疗开展医学活动的模式,近年来医疗众包平台取得了巨大的进展。然而,目前文献内针对医疗众包平台的研究,限于平台建设和平台应用。对比一般化的众包平台,医疗众包
学位
安居乐业从古至今都是人民群众对生活的追求,安居是工作和生活的基本保障,由此可见,“住”一直都是人们最基础的需求。然而,伴随着房地产行业的的高速发展,房地产价格的攀升速度越来越快,房地产市场的供需矛盾变得日益严峻,普通百姓越来越望房兴叹。从一线城市的情况来看,房地产市场相对于其他城市来说,发展较快规模也更大,但是城市有限的房地产资源始终无法满足所有人的需要,房地产价格也是水涨船高,政府虽然出台了多项
学位
近年来,长三角地区在全国现代化建设中发挥着带动作用,无论是经济实力还是综合水平都位列全国领先水平,大力发展长三角地区对于提升全国经济水平而言具有关键性作用。改革开放以来,我国不断完善引资政策,长三角地区也不断加大了吸引外资的力度,吸收了大量的外商直接投资,在联系国内市场及国外市场方面有着举足轻重的地位,并尝试通过打开外商直接投资市场获取技术的政策来促进产业升级。党的十九大报告中明确指出要以产业和经
学位
在我国能源依赖度及环境污染日益趋重的大背景下,政府从2001年就开始着手布局发展新能源汽车产业,在持续的政策加持下,我国的新能源汽车市场迎来爆发。我国新能源汽车销量连续五年位于世界第一,已经成为全球最大的新能源汽车产销市场。整个产业发展过程大致经历了三个阶段:2001年-2009年,是以制定产业战略地位为主的战略萌芽期;2009-2016年,是新能源汽车产业全面参与竞争的市场导入期;2016年至今
学位
近年来,中国的城镇化水平不断提高,在高速的城镇化进程中,“产城分离”对社会资源造成了一定程度的浪费,制约了国民经济的健康发展。对于如何解决“产城分离”的问题,学界提出了“产城融合”的发展理念,认为产城融合有助于实现城市土地的集约化利用,加快产业聚集,凝聚产业活力,构建健康的城市产业生态圈;也有利于增加就业人口,通过产业带动城市功能提升,规避快速城镇化带来的空城现象,有利于人口城镇化有序推进,促进城
学位
一个城市的创新能力往往直接影响着这个城市整体的综合能力及竞争优势。与此同时,国家发展的核心战略也逐步趋向创新引领经济发展的大方向上,因此不断提升城市的创新能力也成为每个城市重要的经济发展策略之一。1978年改革开放以来,随着我国经济水平的飞速发展,城市化进程也取得了空前的发展,城市化水平显著提升。伴随着城市化发展的日渐迅猛,城市化发展对于城市创新能力的促进作用日渐凸显得不容忽视,城市化推动了城市规
学位
计算机视觉,即Computer Vision,是当前研究的热门话题,其主要应用领域包括:物体检测、视频监控、人脸识别、自动驾驶等。而物体识别作为计算机视觉中的一个重要研究领域,也获得了越来越多学者的关注。其主要目的是识别出图像中不同物体的所在位置,并能够判断出不同物体的类别。表面缺陷检测是物体检测的一个分支,它主要通过面阵相机、3D相机等机器视觉设备来捕获物体的影像,并由此推断出物体表面是否存在破
学位
托育服务供给体系的构建事关婴幼儿健康成长,是实现“幼有所育”、保障和改善民生的重要内容。本研究在“三孩政策”背景下开展研究,通过问卷调查法和访谈法了解平顶山市托育服务供给体系现状,建立平顶山市托育服务供给体系理论框架,构建平顶山市托育服务供给体系模型,并提出平顶山市托育服务发展的建议。进一步推动平顶山市托育服务供给体系的建设与完善,为新转折时期河南省托育事业的进一步发展提供有益的思考,从而推动“幼
期刊
创设真实、合适的情境是培养模型观念的基础,让学生经历数学建模的基本过程是形成模型观念的必经途径.本文以一元二次方程单元复习课为例,创设“一意性情境”,通过情境创设、情境抽象、情境拓展、情境迁移四大环节,促进学生提出问题,进而激发学生思维进阶;让学生经历数学建模的基本过程,培育模型观念.
期刊
近年来,受国内经济结构转型以及新冠疫情等因素的影响,国内投资市场出现疲软趋势,出口市场则受国际贸易形势、贸易摩擦的影响,对经济的拉动作用受限,存在后劲不足的问题。经济增长的三驾马车中,出口和投资未能为经济高质量发展提供可持续的增长动力,剩下的“消费”这驾马车,无疑成为当前经济高质量发展的主要推动力。因此,当前背景下,如何刺激居民消费、更好发挥消费刺激经济增长的作用,成为一项值得研究的课题。就我国居
学位