论文部分内容阅读
本文以具有代表性的HLCT平台为例,通过Python网络爬虫所采集的真实交易数据,从借款人的信用等级、借款信息以及历史表现三方面出发,综合运用Logistic和ID3决策树模型对借款人的信息与其违约信用风险的关系进行实证探究。研究结果表明,决策树模型整体上要优于Logistic回归的判别,对违约样本的识别准确率约达87%。在影响因素中,借款额度、贷款额度、评级得分以及按时还款笔数四个变量是影响借款人是否逾期还款的关键指标,且均存在显著的负相关关系。HLCT可根据分类结果设立平台阈值,当借款人的状态进入上述几个风险警报区域之内时,可采取风险防范措施,减少信用风险发生的概率。