Spark集群中还贷问题的逻辑回归模型研究

来源 :武汉工程大学学报 | 被引量 : 0次 | 上传用户:yangyuwu21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在Spark集群环境下,通过Sparklyr调用MLib中的并行逻辑回归算法对大规模抵押贷款数据的训练集进行监督学习,使用R语言建立一个预测客户是否会如期归还贷款的逻辑回归分类模型。为了研究该模型的可信性以及获取效率,本文补充了伪判定系数、分类评价指标、测试集性能几个指标对模型可信性进行评价,并判定了模型的可信性。在获得了可信模型的基础上,实验结果表明:当数据量增加到一定阈值后,在集群环境下使用并行的算法获得逻辑回归分类模型的速度要优于对应的串行算法。
其他文献
土地适宜性评价在推进国土资源优化配置、城乡空间的合理开发中起着基础性作用,是制定合理的土地利用决策的重要前提。以湖北省枝江市为研究对象,基于ArcGIS的数据处理和空间分析统计功能,构建城乡建设用地适宜性评价模型,研究枝江市城乡建设用地适宜性,并将适宜性评价结果划分为5个等级。在此基础上,分别构建研究区城乡建设用地空间格局匹配性研究模型、建设用地开发潜力研究模型和建设用地扩张趋势动态模拟元胞自动机
以某型单级单吸离心泵为研究对象,在保证叶轮的进出口安装角、进出口直径等参数不变的情况下,分别设计了五组不同出口宽度的叶轮,依次对各模型进行数值模拟,分析叶轮出口宽度
池汝安,二级教授,国家杰出青年基金获得者,享受国务院特殊津贴专家,绿色化工过程教育部重点实验室主任。由池汝安教授组建的"矿物加工过程强化"团队是教育部创新团队,现有国
针对起重机吊具防摇系统中PLC实现模糊PID控制算法的迟滞性及编程工作量大等问题,提出将嵌入式系统运用到其防摇控制中.系统采用主从控制方式,将嵌入式处理器设定为从机工作
以高层框架结构为对象,提出一种结合分段隔震和相邻建筑物连接阻尼器耗能的新型混合被动控制体系,能有效应对宽频地面运动,具有较高的鲁棒性和冗余度.通过对同一高层建筑结构
胃食管反流病是一种较为常见的疾病,是由于胃、十二指肠内容物反流至食管引起的烧心、反酸、嗳气、呕吐、上腹胀痛、早饱、胸骨后疼痛、咽部不适或有异物感等,属中医的"嘈杂"、
针对传统的信号波达方向(DOA)估计算法无法适用于实际应用中非均匀噪声、数据不完整等情况的问题,提出了一种结合矩阵补全理论和最大似然交替投影算法的DOA估计方法。在背景
目的了解新农村室内空气质量和不同燃料能源对室内空气质量的影响。方法采用标准方法对居室内空气质量进行检测。结果两河村、下屯村、白草洼村、荞麦峪村在采暖期和非采暖期
为了准确预测离心泵不同工况下的能量性能,基于国内外现有的理论公式和经验公式建立离心泵水力损失模型.运用线性回归的方法找出了叶轮进口冲角与冲击损失系数之间的函数关系
经外周中心静脉置管(peripherally inserted cetral catheter,PICC)是指经外周置入的中心静脉导管,其导管尖端位于上腔静脉的深静脉穿刺技术[1]。利用PICC可以将药物输注在血流