论文部分内容阅读
中国的零售信贷市场不仅客群庞大、需求多样,而且以“信用白户”为主,导致传统银行信贷供给长期存在不充分不均衡的问题。近年来,大数据、机器学习等数字技术与金融业务深度融合,极大地推动了银行业数字化转型,商业银行已成为当前推动我国金融科技高质量发展的绝对主力。然而,现有关于金融科技的相关研究主要以非银金融科技公司或借贷平台为考察对象,且重点集中在宏观或区域层面探讨金融科技行业发展带来的影响,不仅缺乏以商业银行为主体的研究,更是缺乏金融科技如何赋能银行零售信贷效果与机理的微观考察。区别于P2P网络借贷和非银金融科技借贷,商业银行的金融科技借贷不但可以利用金融属性极其丰富的传统征信数据,而且也能在监管制度下合规使用大量金融属性相对缺乏的非传统数据。本文基于信息不对称、信贷配给、金融创新等经典理论,利用国内领先的持牌借贷机构的独特账户数据和银行层面的面板数据,运用多元回归、分类预测、自然语言处理等方法和技术,依次递进地研究三个层面的问题:个人网购订单和手机设备属性两类典型非传统数据分别应用于金融科技借贷的效果与机制;大数据及机器学习与传统征信协同作用于信贷可得性的机理;跨银行层面金融科技水平的测度及其对银行经营和普惠金融的赋能效果。主要研究内容和结论如下:第一,立足持牌借贷机构能够同时使用传统与非传统数据,本文利用46,607个借款人的独特账户数据,在将借款人信息划分为自我报告、央行征信、电商信用评分和网购行为共四类信息的基础上,以自我报告和央行征信两类传统信息的预测能力为基准,考察电商信用评分和网购行为两类数字足迹的违约预测效果及其提高信贷可得性的机理。研究表明:两类数字足迹能够将违约预测的准确性提高约50%,电商信用评分的预测能力最强,而网购行为足迹相对于电商信用评分仍然具有额外信息含量;进一步,数字足迹在金融科技借贷中的应用不仅可为信用白户建立数字信用,还能对真实质量被传统征信错误低估的借款人予以准确的信用评估。第二,鉴于强监管下商业银行对个人隐私的保护,本文利用包含105,242位借款人贷款申请的手机设备信息,构建设备价值属性和系统更新行为两类对个人隐私不太敏感的变量,实证考察二者的信贷违约识别效果,并揭示其发挥作用的经济机制。研究发现:设备属性信息能够相对于人口特征、央行征信等传统信用信息提供增量信息,设备价值属性和系统更新行为分别可以反映借款人的经济状态和认知能力;进一步,借款人具有操纵设备属性信息的动机,而贷款者也会从多次借贷交易中动态学习来有效利用设备属性信息提升甄别能力。第三,针对信用白户的传统征信缺失严重的特点,本文利用包括61,477个借款人的账户数据,以央行征信报告中的数据缺失比例测度其白户程度,通过考察缺失数据背后的隐藏信息及借款人经济特征,揭示大数据及机器学习算法与传统征信协同作用对于提高信贷可得性的机理所在。研究发现:大数据及机器学习的应用可以通过挖掘征信报告中缺失数据的隐藏信息而有效识别信用白户群体中的高质量借款人;进一步,一旦这些高质量借款人获得(首次)金融科技贷款,其后续在传统借贷机构的信贷可得性也将提高,这表明金融科技借贷可通过为信用白户建立信用而发挥金融普惠的正外部性。第四,区别于现有研究主要针对宏观或区域层面的金融科技进行测度及影响考察,本文利用超过17万条的公开新闻文本,使用多种自然语言处理技术测度了1,566家银行个体层面的金融科技发展指数,并利用财务数据完整的472家银行的面板数据,从银行经营和普惠金融两个层面考察了金融科技的赋能效果。研究表明:金融科技可以提高运营、服务和风控能力而显著提升银行经营绩效,金融科技每增加一个标准差,平均约给银行增加1.202亿的净利润;但是,金融科技在促进银行贷款规模增长的同时,并未能显著降低贷款利率,存在因便利溢价或定价歧视导致的“普而不惠”问题。本文的创新与贡献主要体现在如下四点:1.结合数据可得性,本文利用个人网购订单和手机设备属性两类典型的非传统数据,深入考察了二者的违约识别能力并重点探究其机制,理论上揭示出金融科技借贷中非传统数据提高信贷可得性的内在机理,尤其是从难以收集或直接观测的经济状态、个人特质、偏好习惯、行为方式、认知能力等角度,建立了从非传统数据中提取的非金融属性特征和借款人违约行为之间的理论联系,并提供了支持理论机理的丰富经验证据,有助于理解金融科技提升银行甄别能力的本质原因。2.相对于非银金融科技借贷平台,发展零售信贷的商业银行能够同时使用传统征信和非传统数据。针对零售信贷市场以“信用白户”为主的特征,本文利用借款人征信报告的数据缺失比例来衡量其白户程度,创新性地从大数据及机器学习算法能够挖掘征信缺失数据背后的隐藏信息的视角,揭示了金融科技借贷何以提高信用白户信贷可得性的内在机理与现实效果,并从促进信用体系构建的视角,探讨了金融科技借贷促进金融普惠的正外部性。3.现有研究构建宏观或区域层面的金融科技指数,并重点考察金融科技行业发展对家庭、企业、银行以及金融经济系统的影响,但主要以非银金融科技平台为对象的做法,往往将商业银行视作遭受冲击的对象,不仅忽略了商业银行主动发力金融科技的行业现实,更是缺乏银行个体层面金融科技水平的测度及其赋能效果的考察。本文利用多种自然语言处理技术,构建了跨银行、多维度的金融科技指数,并从银行经营和普惠金融两个层面考察了金融科技的赋能效果及机制。而且,商业银行金融科技指数的构建不仅为后续相关问题的研究提供了数据基础,还能为基于文本分析的其他问题研究提供方法参考。4.立足大数据与机器学习等数字技术广泛被应用的现实情境,本文探索性地考察了零售信贷市场上借款人和借贷机构的决策行为与策略反应,这不仅加深了人们对金融科技借贷参与主体微观行为的认识,还有助于指导金融科技借贷机构的决策实践。在关于手机设备属性的违约识别效果研究中,本文发现借款人具有操纵数据的动机,借贷机构则会通过多次借贷动态学习以有效使用此类信息。在关于金融科技借贷提高信用白户信贷可得性的研究中,本文发现金融科技借贷为信用白户建立的信用记录,后续会被传统借贷机构及时利用来更新其信贷决策。