论文部分内容阅读
20世纪70年代后期,随着中国经济的快速发展,我国的信用消费市场悄然兴起,信用卡消费、个人住房贷款、汽车贷款、耐用消费品贷款、助学贷款等各种形式的信用消费陆续走进人们的生活。信用消费市场的形成是以信用销售为前提的。在信用销售过程中,会存在各种各样的风险。我们通常将客户到期不付款或客户无法按期还款所产生的风险称为信用风险。对客户进行信用分析可以帮助投资者、银行选择信誉良好的客户、剔除风险较大的客户,保护对投资者、银行有较大价值的客户,赢得那些真正优质客户的信任,同时能在最大限度降低风险的前提下,维护银行、投资者自身利益。对于信用风险评估模型研究,国外研究者大多是从借贷市场和公司债券市场入手,通常是选取破产企业与存续企业,违约贷款(债券)与非违约贷款(债券)作为样本来分析对象,分析出财务趋向特征指标,并利用指标建立起信用风险评估模型,从而应用于信用风险评估。在中国,其借贷市场和债券市场都还处于发展阶段,破产企业财务信息及借贷市场资料数据的相对较难获得,同时市场里也没有建立起相关的信息数据库,而企业在银行的债务特征和履约情况又属于银行内部机密,外界也很难获得。相比之下,中国股票市场发展相对成熟发达。随着我国经济体制改革的不断深入和国民经济的快速发展,上市公司的数量和规模不断扩大,现在已经成为国民经济的重要组成部分。所以国内大多数研究都是利用相对成熟的股票市场信息,以中国股票市场上的上市公司的财务状况信息作为评估企业信用风险的重要依据。本文在研究国内外信用风险度量方面和数据挖掘技术方面文献的基础上,介绍了数据挖掘技术的基本原理和信用风险理论,分析了几种主要的数据挖掘技术的优点与不足。在此基础上提出了建立我国上市公司信用风险评估模型的方法。本文利用数据挖掘方法判别离群数据,利用决策树、Logistic回归方法建立信用风险评估模型,验证模型。通过对能反映公司主要营能力的重要财务指标变化情况的分析,预测公司的信用风险估计值,进而为投资者、银行或交易双方提供了科学的决策依据。本论文分为以下几个部分来介绍:第一章主要介绍了本论文的选题背景,分析了选题意义,对信用风险评估领域的国内外主要成果进行了文献综述,最后给出了本论文所采用的研究思路和整体框架。第二章主要介绍信用风险的概念、特点,及对现代信用风险评估方法中,对主要违约概率估计的方法一一进行论述和评价。第三章主要介绍数据挖掘技术中的决策树、Logistic回归方法及它们的优缺点。第四章实证分析,主要介绍了研究样本选取、指标选取、数据来源、数据处理与模型建立、模型检验及结果分析。第五章结论与展望,得出了本文研究的主要结论,并对本研究的不足及后续研究方向进行总结并提出了方向。