基于多源文本的信用风险评估研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wangqingj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今自然语言处理技术日新月异,其应用领域正在逐渐扩展到当前已知研究领域,各个研究领域的学者也都在研究如何利用自然语言处理技术使当前领域的研究成果迈向新的阶段。在中小企业信用风险研究中依然如此,当前中小企业发展的重要性在国家经济地位中逐步提高,但是关于商业银行以及投资者对于中小企业的扶持却与其所占地位不符,这是由于无法获取中小企业的经营信息以及其资信水平导致的,商业银行以及投资者无法正确对中小企业的信用水平进行评估,从而导致了信用风险的产生。通过梳理近年来中小企业信用风险的相关研究,发现仅集中于财务数据方面的研究会构建出不完善的信用风险评估系统,并且其使用方法多数为传统机器学习算法,利用深度神经网络来进行中小企业信用风险评估的文献占比较少,因此本文着眼于如何利用多源文本数据以及深度学习方法来构建行之有效的信用风险评估系统,阐述了中小企业及其信用风险的定义、特点,与此同时也阐明了自然语言处理相关核心技术的概念以及原理。深入分析了自然语言处理核心流程:任务类型、数据处理、构建模型以及模型评估。对数据处理进行研究分析时,分别以中、英两种语言的数据进行相关说明,针对英文数据构建模型时,在对已有模型进行分析的基础上,本文综合运用了卷积神经网络和门机制,创新性的提出了SGCN模型。通过收集和整理与中小企业相关的舆论以及报道信息并形成特定格式的信用风险数据集,利用中文数据处理方法对该数据进行逐层分析处理,以数据中出现的中小企业作为考察对象,对该数据进行深度学习和训练,构建出适应信用风险数据集的SGCN模型,并以10家中小企业进行模型的可行性验证。实验结果显示,针对中小企业的舆论及报道信息,SGCN模型对于鉴别中小企业信用风险达到了87.69%的准确率,相较于传统鉴别模型85.68%的准确率有着接近两个百分点的提升,对于不同行业的中小企业依然有着一定的泛化能力,对于未知行业的信用风险评估SGCN同样有着高达70%的准确率,达到了理想中的预测效果。因此,在商业银行以及投资者对中小企业信用风险鉴别时,SGCN模型提供了一种基于多源文本的准确、方便快捷识别中小企业信用风险的方法,为其在防控信用风险时提供了参考依据。
其他文献
针对中子产额范围宽、下限低,研制4个具有高中子探测效率的正比探测器,由置于慢化体内的BF3正比计数管阵列和电压前置放大器组成。每个探测器内共包括12支BF3正比计数管,并根据
会议
背景:二尖瓣反流模型根据模型来源分为:小动物二尖瓣反流模型、大动物二尖瓣反流模型、体外二尖瓣反流台架模型等;根据发病机制又分为原发性二尖瓣反流模型、继发性二尖瓣反
运用地磁加卸载响应比方法(LURR)对华北地区23个地磁台站2008—2014年的数字化地磁相对记录数据进行计算分析,结果显示华北地区7年内发生了38次共计10组加卸载响应比异常,其中7
以碳五分离装置为例,对热偶精馏塔用于非理想体系的操作特性和节能效果进行了模拟分析与研究。根据分离 要求确定了热偶精馏塔的操作特性,研究了热偶精馏塔的节能效果,探讨其
本文以《汽车服务企业管理》课程为例进行实践研究,通过微信平台让学习者突破时间、空间的限制,真正的实现无时无处不在的泛在学习,利用琐碎的时间不断的提高自己的学习水平
翠湖公园作为昆明城市文脉之一,沉淀了悠久的文化历史,寄存着昆明人的城市记忆。多年来,经过政府、企业的不断规划设计,如今翠湖公园已成为昆明城市中心的名片。但改造后的翠
一个美好的城市应该是个“完整”的城市。然而,在城市规划的理论和实践上.个体与整体的辨别实在是个既关键又困扰的难题。一个新的规划方法论是,在和谐的整体与个体关系的前提下
百年大计,教育为本。教育是立国之本,民族兴旺的标记,一个国家有没有发展潜力看的是教育,这个国家富不富强看的也是教育。无论什么时代?什么社会?什么制度?这个国家向那方面
<正>拒绝冷落,施以温暖。最有效的策略是给予温暖和体贴,在任何情况下都不要流露出对他们的表现漠不关心的态度,可以在学习、工作、生活的细节上多为他们做一些实实在在的事
期刊
纸药的应用虽是传统造纸技术中一重要的环节,但纸药的发明要晚于造纸术的发明。蔡伦发明纸药一说以公成立。目的所知开始使用纸药的时间不会早于唐代,约在唐末至五代期间或更晚