论文部分内容阅读
[摘要]本文首先简要说明什么是神经动力学,然后简介神经动力学模型中的BSB模型和多层感知器(MLP)模型,再说明如何将神经动力学应用于信用评级问题,最后对这种应用做出评价。
[关键词]神经动力学 神经网络 BSB模型 MLP模型信用评级
[中图分类号]F224 [文献标识码]A [文章编号]1009-5349(2016)22-0255-02
一、引言
神经网络在最近20年中得到了迅速的发展,有关的论文及著作已有許多,而神经网络与数学中动力学系统理论的交叉结合(称之为神经动力学)虽也有所发展,但是在应用上却不是很广泛。
自然界中的现象,我们都可以用数学模型去描述,大体上分为两类,一类是确定性的数学模型,另一类是随机性的数学模型。而动力学模型是最普遍的确定型的数学模型。
在信用风险管理中,信用评级是其重要的组成部分。持续的评估可以帮助信用管理者监测客户的账户。对于现金充足的大公司来说,对银行的评估有助于帮助他们决定分别应在各家银行存入多少钱。对于寻求贷款的企业,几个银行的评估有时可以指导他们选择合适的银行来借款。
许多大的公司、银行、政府及政府机构现存的债务都有各自的信用评级。评级通常是由穆迪标准普尔和惠誉(IBCA)这样的专业机构完成的。根据企业评级结果,银行可以决定对该企业的贷款使用何种等级的贷款利率。例如,一个信用等级较低的企业贷款利率会比较高。企业可以利用银行评级来决定他们在银行的存款额度。
本文着重说明神经动力学模型能够在信用风险管理中得到应用,试图做到举一反三,而不做实证分析,为推动神经动力学在信用分析中的应用提供一些参考意见。尤其是在信用评级分类中,神经动力学模型对数据的要求没有传统的评级方法的要求那么高,且应用较其他领域更直接一些,下面我就来介绍几个比较典型的神经动力学模型。
二、神经动力学模型
(一)数学模型
一个神经网络包括n个处理单元,对于第i个单元,有三个相关的实数:网络的输入信号,行为的状态以及输出。输出是行为状态变量的函数,输入是所有状态和一个实参数矩阵——权重矩阵()的函数。一般假定 ,此处看成是从第j个神经元到第i
个神经元的传送线路的强度。
为了完成对神经网络的数学描述,我们通过指定表达状态随时间改变的方式的一种规则,即一种动力学使神经网络置于一个动力系统之中。
1.离散的单层反馈形神经网络的动力学模型
N个神经元排列成一个单层,如果它构成全反馈的网络,这其中的每个神经元的输出都与其他神经元的输入相连,又整个网络的输入与输出的神经元数是相同的,都为N。如果假设第j个神经元在时刻t的输出为,那么在时刻t的N个神经元的输出向量可表示为,又假设第i个神经元时刻t的内部状态为,即可得到时刻t的N个神经元的内部状态为向量,若
其中f可以是最简单的二值函数H,也可以S是形单调连续函数,那么得到离散的单层反馈神经网络。下面介绍离散的Hopfield神经网络。
假定在(1)中的f取二值符号函数,sgn形式,又第i个神经元在时刻t的内部状态
其中是权重,是内部状态值。如果,那么,即第i个神经元在t 1时刻兴奋;如果 ,那么,即第i个神经元在t 1时刻抑制。
我们的目的是先求出权重,然后求出,最后根据 的大小和权重对输出进行分类。
2.BSB模型
①BSB模型
设W是对称矩阵,且其最大的特征值有正的实部。记是模型的初始状态向量,表示启动一个输入。假设模型由N个神经元构成,状态向量的维数也为N,矩阵W是N×N阵,于是BSB模型的算法可以由以下方程完全给出:
其中β是小正常数,称之为反馈因子,是离散时间的状态向量,W表示单层线性神经网络。函数φ是一个分段线性函数依赖于,
其中是的第j个分量。
②模型的应用——分类
BSB模型的一项基本的应用就是分类,这是由于作为吸引子的超立方体的顶点和相应的定义完善的区域,于是BSB模型被用来作为一种无监护的分类算法,而每一个不动点代表一组相关的数据构成的分类,由正反馈产生的自我放大是分类方法的最重要的特征之一。
Anderson于1990年描述了利用BSB模型进行分类的方法,它可以从不同的放射射线中区分出辐射的信号。在这一应用中,权矩阵是通过误差纠正的线性相关的学习过程得到的。为了详细说明,假设有K个训练的向量
随机选择向量,于是权矩阵可以根据偏差纠正算法得到
其中η是学习率参数。根据计算,输入向量像其“老师”一样表现,因为线性结合会重新构造输入向量,而学习的目标是使得
由式(6)给出的纠偏算法在最小均方意义下接近于理想的条件(7)。学习的过程是为了促使线性结合器给出一组特征向量,相应的特征值等于1。为了模拟雷达分类,BSB模型应用上述方法给出了权矩阵。
3.感知器模型
感知器是由F.Rosenblatt于1957年提出的。设为输入量,y为输出量,输入与输出之间满足:
其中为权系数,θ为阈值,函数为分段常数函数,
令,那么
于是问题化为已知两个样本集分别为,要求权系数和阈值使得
如果A,B两类样本是线性可分的,即可用一根直线将两类样本分隔开来,而且有一段距离(参见图1),那么形如(8)式的解有无数个。我们采用单层感知器来求解这个问题。
又如图2所示的二维平面中,A类样本分布在原点的附近,B类样本分布在A类样本的外部区域中,两类样本不能用直线分隔开来。
对于图2的问题,就是寻找一个区域,使其内部为A类样本,其外部为B类样本。可以在二维输入空间中划出三根直线,因为他们的权系数和阈值各不相同,因此3根直线的斜率与截距也不相同(如图3所示)。将这三个单元所得到的直线作相应的逻辑运算。
[关键词]神经动力学 神经网络 BSB模型 MLP模型信用评级
[中图分类号]F224 [文献标识码]A [文章编号]1009-5349(2016)22-0255-02
一、引言
神经网络在最近20年中得到了迅速的发展,有关的论文及著作已有許多,而神经网络与数学中动力学系统理论的交叉结合(称之为神经动力学)虽也有所发展,但是在应用上却不是很广泛。
自然界中的现象,我们都可以用数学模型去描述,大体上分为两类,一类是确定性的数学模型,另一类是随机性的数学模型。而动力学模型是最普遍的确定型的数学模型。
在信用风险管理中,信用评级是其重要的组成部分。持续的评估可以帮助信用管理者监测客户的账户。对于现金充足的大公司来说,对银行的评估有助于帮助他们决定分别应在各家银行存入多少钱。对于寻求贷款的企业,几个银行的评估有时可以指导他们选择合适的银行来借款。
许多大的公司、银行、政府及政府机构现存的债务都有各自的信用评级。评级通常是由穆迪标准普尔和惠誉(IBCA)这样的专业机构完成的。根据企业评级结果,银行可以决定对该企业的贷款使用何种等级的贷款利率。例如,一个信用等级较低的企业贷款利率会比较高。企业可以利用银行评级来决定他们在银行的存款额度。
本文着重说明神经动力学模型能够在信用风险管理中得到应用,试图做到举一反三,而不做实证分析,为推动神经动力学在信用分析中的应用提供一些参考意见。尤其是在信用评级分类中,神经动力学模型对数据的要求没有传统的评级方法的要求那么高,且应用较其他领域更直接一些,下面我就来介绍几个比较典型的神经动力学模型。
二、神经动力学模型
(一)数学模型
一个神经网络包括n个处理单元,对于第i个单元,有三个相关的实数:网络的输入信号,行为的状态以及输出。输出是行为状态变量的函数,输入是所有状态和一个实参数矩阵——权重矩阵()的函数。一般假定 ,此处看成是从第j个神经元到第i
个神经元的传送线路的强度。
为了完成对神经网络的数学描述,我们通过指定表达状态随时间改变的方式的一种规则,即一种动力学使神经网络置于一个动力系统之中。
1.离散的单层反馈形神经网络的动力学模型
N个神经元排列成一个单层,如果它构成全反馈的网络,这其中的每个神经元的输出都与其他神经元的输入相连,又整个网络的输入与输出的神经元数是相同的,都为N。如果假设第j个神经元在时刻t的输出为,那么在时刻t的N个神经元的输出向量可表示为,又假设第i个神经元时刻t的内部状态为,即可得到时刻t的N个神经元的内部状态为向量,若
其中f可以是最简单的二值函数H,也可以S是形单调连续函数,那么得到离散的单层反馈神经网络。下面介绍离散的Hopfield神经网络。
假定在(1)中的f取二值符号函数,sgn形式,又第i个神经元在时刻t的内部状态
其中是权重,是内部状态值。如果,那么,即第i个神经元在t 1时刻兴奋;如果 ,那么,即第i个神经元在t 1时刻抑制。
我们的目的是先求出权重,然后求出,最后根据 的大小和权重对输出进行分类。
2.BSB模型
①BSB模型
设W是对称矩阵,且其最大的特征值有正的实部。记是模型的初始状态向量,表示启动一个输入。假设模型由N个神经元构成,状态向量的维数也为N,矩阵W是N×N阵,于是BSB模型的算法可以由以下方程完全给出:
其中β是小正常数,称之为反馈因子,是离散时间的状态向量,W表示单层线性神经网络。函数φ是一个分段线性函数依赖于,
其中是的第j个分量。
②模型的应用——分类
BSB模型的一项基本的应用就是分类,这是由于作为吸引子的超立方体的顶点和相应的定义完善的区域,于是BSB模型被用来作为一种无监护的分类算法,而每一个不动点代表一组相关的数据构成的分类,由正反馈产生的自我放大是分类方法的最重要的特征之一。
Anderson于1990年描述了利用BSB模型进行分类的方法,它可以从不同的放射射线中区分出辐射的信号。在这一应用中,权矩阵是通过误差纠正的线性相关的学习过程得到的。为了详细说明,假设有K个训练的向量
随机选择向量,于是权矩阵可以根据偏差纠正算法得到
其中η是学习率参数。根据计算,输入向量像其“老师”一样表现,因为线性结合会重新构造输入向量,而学习的目标是使得
由式(6)给出的纠偏算法在最小均方意义下接近于理想的条件(7)。学习的过程是为了促使线性结合器给出一组特征向量,相应的特征值等于1。为了模拟雷达分类,BSB模型应用上述方法给出了权矩阵。
3.感知器模型
感知器是由F.Rosenblatt于1957年提出的。设为输入量,y为输出量,输入与输出之间满足:
其中为权系数,θ为阈值,函数为分段常数函数,
令,那么
于是问题化为已知两个样本集分别为,要求权系数和阈值使得
如果A,B两类样本是线性可分的,即可用一根直线将两类样本分隔开来,而且有一段距离(参见图1),那么形如(8)式的解有无数个。我们采用单层感知器来求解这个问题。
又如图2所示的二维平面中,A类样本分布在原点的附近,B类样本分布在A类样本的外部区域中,两类样本不能用直线分隔开来。
对于图2的问题,就是寻找一个区域,使其内部为A类样本,其外部为B类样本。可以在二维输入空间中划出三根直线,因为他们的权系数和阈值各不相同,因此3根直线的斜率与截距也不相同(如图3所示)。将这三个单元所得到的直线作相应的逻辑运算。