论文部分内容阅读
随着互联网技术的快速发展,P2P网络借贷(Peer-to-Peer Lending)这种线上借贷模式迅速兴起。对于借款人来说,P2P网络借贷扩大了他们的融资渠道,可以获得来自世界各地投资者的资金,且贷款利率合理。对于投资者来说,P2P网络借贷平台上的贷款,是一种新型的理财产品,手里富余资金可以投资到平台的贷款中,进行投资获得回报。这种基于互联网的新兴商业模式,满足许多因为不符合银行标准而无法从银行获得服务的客户需求,有着巨大的发展潜力。然而近年来,P2P网络借贷存在的违约风险高和投资者满意度低的问题阻碍了平台的发展。以往的P2P投资决策研究大多只关注贷款本身,没有考虑投资者风险偏好;或者少数虽考虑到投资者的风险偏好,但是所用模型不够实用,导致最终决策出的结果往往不能使投资者满意。近年来,越来越多的研究表明证券投资组合理论应用到P2P投资决策中有很强的实用性。利用投资组合理论做P2P投资决策的整个流程是先计算出贷款的违约概率,然后在此基础上预测出贷款的收益率和风险,再带入到P2P投资组合模型中求解出最优的投资组合。本文在此基础上,应用机器学习技术完善流程中的违约概率计算部分,并在构建P2P投资组合模型时考虑投资者的风险偏好,优化投资决策模型,从而提升投资者对P2P网络借贷投资的满意度。论文研究内容主要包括三部分:(1)构建基于RFLR(随机森林&逻辑回归)的P2P网络借贷违约概率预测模型。分析影响贷款的违约因素,说明RF(Random Forest,随机森林)选择特征和LR(Logistic Regression,逻辑回归)计算违约概率的原理。从P2P平台Lending Club官网获得数据,对数据进行预处理。通过RF模型选择出最优的特征子集,与目标变量组合成一个新的数据集,采用网格搜索法结合交叉验证的方式调参,在最优参数组合下训练出最优LR模型,利用此模型计算出贷款的违约概率。实验发现重要性较大的特征有24个,其中贷款利率、收入负债比率、信用记录最早出现的时间、月还款额和年收入这五个特征重要性最高。说明这些特征最能反映贷款未来的违约情况,投资者和P2P网络借贷平台在借款人申请贷款时要重点关注这些指标:(2)构建基于实例的P2P网络借贷收益率和风险预测模型。介绍实例模型的思想和过程、KR(Kernel Regression,核回归)模型确定权重参数的原理。在上一部分研究已经求出贷款违约概率的基础上,将贷款样本分为已知收益率的历史贷款样本和预测收益率及风险的新贷款样本。对历史贷款采用舍一交叉验证最小化误差的方法,求得KR模型的最优宽度。利用输入最优宽度的KR模型求得历史贷款和新贷款之间的相对权重,在此基础上将历史贷款收益率结合相对权重的加权平均值作为新贷款收益率的预测值;历史贷款收益率的方差作为新贷款收益的风险;(3)建立考虑投资者风险偏好的投资组合模型。介绍传统的投资组合模型,风险偏好的概念及其对投资者决策的影响。从实际出发,构建一个考虑投资者风险偏好的投资组合模型作为本文的P2P投资决策模型。模型的目标是收益减去风险最大,通过调节风险偏好大小反映投资者在两者之间的权衡。模型的决策变量是投资比例和反映是否投资的0-1变量。模型的约束条件包括:投资所有贷款的收益不能低于投资者期望的最低收益;投资者一旦投资某笔贷款时,投资金额要大于P2P平台要求的每笔贷款的最低投资金额;投资者一旦投资贷款时,投资金额要小于贷款本身的金额;投资比例之和为1。此模型构建完成之后,进行数值实验验证。因为这是一个混合整数规划模型,所以本文使用Matlab中的Cvx包调用Gurobi求解。实验过程中,把在上一部分已经计算出收益率和风险的新贷款作为本次实验投资者投资的产品。在不同风险偏好下,把新贷款带入到构建的模型当中求解最优投资组合。比较投资决策结果和对应的风险偏好投资者的特点,验证模型的实用性和可行性。实验发现不同风险偏好的投资者,面对相同的投资产品,在实验中得到的投资决策结果不同。分析决策出的投资组合情况,发现贷款的分布情况和对应投资者的风险偏好程度匹配,验证本文建立的考虑投资者风险偏好的P2P网络借贷投资组合模型的合理性和科学性,在一定程度上具有辅助投资者做出最优决策的价值。