基于自适应共振模型的信用风险评估

时间:2022-09-16 06:10:13

基于自适应共振模型的信用风险评估

关键词:自适应共振,神经网络,信用风险

摘要:自适应共振模型是为了能够分类任意次序模拟输入模式而设计的,它可以按任意精度对输入的模拟观察矢量进行分类,较好地解决了前稳定性和灵活性问题,同时能够避免对网络先前所学的学习模式修改。本文将ART2模型应用于信用风险评估,通过实证比较研究,结果显示应用自适应共振模型进行信用风险评估在精度和准确性上,都优于其他神经网络模型和统计方法。

1统计方法用于信用风险分类评估存在的局限性

对信用风险评估一类主流方法是基于分类的方法,即把信用风险分析看成是模式识别中的一类分类问题—将企业划分为能够按期还本付息和违约两类。其具体做法是根据历史上每个类别(如期还本付息、违约)的若干样本,从已知的数据中发现其规律,从而总结出分类的规则,建立判别模型,用于对新样本的判别,这样信用评估就转化为统计中的分类问题。传统的统计模型主要基于多元统计分析方法,根据判别函数的形式和样本分布的假定不同,主要的模型有:多元回归分析模型、多元判别分析模型(MDA)、Logit分析模型、近邻法等。其中以多元判别分析模型和Logit分析模型应用最为广泛,已有大量商业化软件。

尽管这些方法在国外有大量应用,但是大量实证研究(Altman,1983;Tam & Kiang,1992;Altman,et al,1994)结果发现:(1)企业财务状况的评价可以看作是一类基于一系列独立变量基础上的分类问题;(2)企业财务状况好坏与

财务比率的关系常常是非线性的;(3)预测变量(财务比率)可能是高度相关的;(4)大量实证结果表明,许多指标不成正态分布。而统计的方法却不能很好地解决以上问题。由此可见统计模型的最大优点在于其具有明显的解释性,存在的缺陷是过于严格的前提条件。如多元判别分析模型(MDA),它要求数据服从多元正态分布、等协方差、已知先验概率和误判代价等要求,而现实中大量数据严重违背了这些假定(Eisenbeis,1997)。引入对数变化可在一定程度上改进数据的非正态分布,但一方面变换后的变量可能失去经济解释含义,另一方面仍没有满足等协方差的要求;应用二次差别分析(QDA)虽可解决等协方差问题,但一方面没有满足正态性假设,另一方面当数据样本小、维数高(指标多)时二次差别分析的性能明显下降,而样本少、维数高正是我国信用数据的显著特点。实证结果还表明二次差别分析对训练样本效果较好,而对测试样本并不理想。除此以外,多元判别分析模型适用于成熟行业的大中型企业,因为这些企业具有较强的稳定性和规范性,其发展有一定的规律可循,参数统计方法易于给出较准确的结果及合理的解释。然而这类方法是静态的,需要根据地区、行业经济情况的变化不断地调整参数,甚至进行变量的调整。

为了解决这些问题,引入了Logit分析模型和近邻法。Logit分析模型不需要假定任何概率分布,也不要求等协方差,但是当样本点存在完全分离时,模型参数的最大似然估计可能不存在,模型的有效性值得怀疑,另外该方法对中心区域的差别敏感性较强,导致判别结构的不稳定。近邻法不要求数据正态分布,但当数据的维数较高时,存在所谓的“维数祸根(Curse of dimensionality)”——对高维数据,即使样本量很大,其撒在高维空间中仍显得非常稀疏,绝大多数点附近根本没有样本点,这就使得“利用空间中每一附近的样本点来构造估计”的近邻法很难使用[4]。

2应用神经网络进行信用风险评估的意义

商业银行信用风险评估是复杂的过程,除了对企业的财务状况的各种特征的评估外,还须对企业的非财务状况进行评估,而且又涉及宏观经济环境和产业结构、产业周期的影响;除了客观的评估外,还依赖于专业人员依据经验进行主观评估。神经网络是一种具有模式识别能力,自组织,自适应,自学习特点的计算机制,它的知识编码于整个权值网络,呈分布式存储且具有一定容错能力。神经网络对数据的分布要求不严格,也不必要详细表述自变量与因变量之间的函数关系,神经网络的这些特征使之成为信用风险分析方法的一个热点。

建立商业银行信用风险评估模型必须依赖于一组已知的函数集合。要求这种函数集合在任意精度上可以逼近实际系统,从数学上讲,这就要求这个集合在连续函数空间上是致密的。目前已经从理论上严格证明了只用一个隐藏层的神经网络就可以唯一地逼进任何一个连续函数。多层神经网络为系统的辨识和建模,尤其是非线性动态映射系统提供了一条十分有效的途径。非线性动态映射系统的神经网络建模被认为是应用神经网络的最成功的范例。

影响商业银行信用风险评估的机理很复杂,无法建立精确的非线性动态模型,而人工神经网络擅长处理非线性的、关系不确定的十分复杂以至于数学模型难以描述的问题。对于分析时间序列数据,由于人工神经网络能识别和模拟数据间的非线性关系,不需要正态分布和先验概率等条件的约束,能针对新增样本灵活的训练再学习,因此优于其他统计方法,同时由于网络本身具有自学习的功能,预测结果相对精度较高而且稳定性好,因此应用神经网络可以通过对网络的训练,掌握借款人的财务特征的非线性函数关系。神经网络是由许多神经元构成的,它对系统特性的记忆表现为各个神经元之间的连接权值,单个神经元在整个系统中起不到决定性作用,一个经过训练的神经网络可以按相似的输入模式产生相似的输出模式,当商业银行信用风险评估系统因某些非财务风险因素和判断误差过大的财务风险因素造成输入模式变形时,网络仍可以保证稳定的输出。

神经网络可以逼进任意复杂的非线性系统,神经网络的转换函数能够非线性地响应冲击,例如,像覆盖比率这样的财务比率超过最低水平(如AAA级)时,超过这个阀值的增加值不会对信用质量有什么影响。线性回归不能以这样的方式限制响应程度,神经网络的转换函数却能实现。神经网络以并行的方式处理信息,具有很强的信息综合能力,因此神经网络理论在商业银行信用风险分析和实施对信用风险的主动控制中将会发挥更大的作用。

由神经网络构成的非线性模型具有较强的环境适应能力。在根据多个训练样本企业的财务特征建立神经网络非线性系统后,如果企业类型、财务特征和非财务特征发生变化,神经网络可以通过学习,建立企业信用的非线性函数关系,并且不需要改变网络的结构和算法。

综上所述,对于那些无法建立精确的动态判别函数模型的非线性商业银行信用风险评估,可以将神经网络理论应用于风险评估当中,撇开企业财务因素、非财务因素和企业信用状况复杂的非线性机理,建立起非线性风险映射近似的动态模型,使这个模型尽可能精确地反映风险映射关系非线性动态特征。通过该系统我们能够计算对各种输入的响应,预估商业银行信用风险状况及其发展趋势,进而能够使用各种信用工具对风险进行主动控制,促进商业银行的智能化风险管理系统的建设和发展完善。

3基于自适应共振理论的信用风险评估模型

一个公司财务状况的好坏往往是企业自身、投资者和债权人关注的焦点。因为一个营运良好、财务健康的公司可提高自身在市场上的信誉及扩展筹资渠道,以使投资者信心倍增。相反,一个陷入财务困境和濒临破产的企业不仅乏力吸引投资,还让原有投资者面临巨大的信用风险。

由上文的分析中我们知道,对企业财务指标的分析,传统的分类方法尽管有它的优点但本身也存在一些局限性。作为研究复杂系统的有力工具,神经网络能处理任意类型数据,这是许多传统方法无法比拟的。通过不断学习,能够从未知模式的大量复杂数据中发现其规律。神经网络方法克服了传统分析过程的复杂性及选择适当模型函数形式的困难,它是一种自然的非线性建模过程,毋需分清存在何种非线性关系,给建模与分析带来极大的方便。该方法用于企业财务状况研究时,一方面利用其映射能力,另一方面利用其泛化能力,即在经过一定数量的带有噪声的样本训练之后,网络可以抽取样本所隐含的特征关系,并对新情况下的数据进行内插和外推以推断其属性。

目前我国银行机构主要使用计算贷款风险度的方法进行信用风险评估——在对企业进行信用等级评定的基础上,考虑贷款方式、期限以及形式因素,进而确定贷款的风险度。其中作为核心的信用等级评定,是通过对企业的某些单一财务指标进行评价,而后加权平均确定的。该方法的最大缺陷在于指标和权重的确定带有很大的主观性,使得评级结果与企业的实际信用状况有很大出入,因此需要引入科学方法来确定有效指标,并建立准确的定量模型来解决信用评估问题。

针对这种形势,根据我国商业银行的具体情况,结合国际上目前较为流行人工神经网络技术,本文设计了一种基于自适应共振理论的信用风险评估方法。

3.1自适应共振理论(ART)介绍

自适应共振理论(Adaptive Resonance Theory)简称ART,是于1976年由美国Boston大学S. Grossberg提出来的。他多年来一直潜心于研究用数学来描述人的心理和认知活动,试图为人类的心理和认知活动建立统一的数学理论,ART就是这一理论核心部分,又经过了多年的研究和不断发展,至今已经提出了ART1、ART2和ART3共三种结构。ART网络作为模式分类器较好地解决了前面提到的稳定性和灵活性问题。使用ART网络及算法具有较大的灵活性以适应新输入的模式,同时能够避免对网络先前所学的学习模式修改。ART是一种能自组织的产生对环境认识编码的神经网络理论模型,由于横向抑制是自组织网络的特性,ART采用了MAXNET子网结构,该网络采用横向抑制方法增强并能选择具有最大值输出的一个节点。

ART模型的算法过程如下:

第一, 将一个新样本X置入节点;

第二,采用自下而上的过程,求得: ;

第三,运用MAXNET网络,找到具有最大输出值的节点;

第四, 通过自上而下的检验,判断X是否属于第j类,即如果有 ,则X属于第j类, 是警戒参数。如果上式不成立,转到第六步,否则继续。

第五, 对于特定的j和所有的i更新 和 ,设t+1时刻 , , , 。

第六, 无法判断X是否属于第j类,抑制该节点返回到第二步,执行另一个聚类的处理过程。

本文所使用的神经网络模型就是ART2神经网络模型。ART2神经网络是为了能够分类任意次序模拟输入模式而设计的。它可以按任意精度对输入的模拟观察矢量进行分类。

3.2应用ART2神经网络进行信用风险评估的可行性分析

通过上文对ART2神经网络的介绍,笔者认为将ART2神经网络应用于信用风险评估具有统计方法和其他神经网络算法无法比拟的优势。首先,ART2神经网络较好地解决了稳定性和灵活性问题,它可以在接受新模式的同时对旧模式也同样保持记忆,而其它类型神经网络所记忆的样本个数有限,由此可见,ART2神经网络随着输入样本数的增加,它作为模式分类器分类的精度也越高,所覆盖的样本空间也越大。其次,ART2神经网络是边学习边运行的无监督学习,所以它不存在像BP算法那样需要进行几小时甚至更长时间的训练过程,也就是说ART2网络具有较高的运行效率和较快的学习速率,这一点对于解决像信用风险评估这样的复杂问题来说是相当具有优势的。再次,ART2神经网络与人脑的某些功能类似,能够完成识别、补充和撤销的任务。这三种功能在英文中称为Recognition,Reinforcement和Recall,可简称为3R功能。识别功能在上文已经介绍过,下面对补充、撤销功能做些简单介绍。补充功能包含有以下几方面的内容:(1)每当ART2系统对输入矢量的类别作一次判决即是给出矢量所属类别的输出端编号,根据此判决,系统可以采取一种“行动”或者作出某种“响应”。这和人总是根据对外界情况的判断来决定自己的行动相似。(2)人在识别时对于所有被识别的类并不是一视同仁的,识别过程受到由上向下预期模式的很强制约。这样就会使得人们在某些情况下只关心几种类别,而对其他类别则“不闻不见”,这种集中注意力的本领可以使人们在混乱的背景中发现目标。在客体发生某种变形或缺损或者有强噪声情况仍能对其正确分类。我国商业银行进行信用风险分析的起步较晚,有关的信息往往残缺不全,ART2网络的这种在混乱中集中注意力发现目标的功能更适合我国的现实数据情况。撤消功能的作用与补充功能相反,这是指某些不同的观察矢量在初步分类时被划分成不同的类别,但是通过系统(主体)与客体相互作用的结果,又应判定它们属于同一类。由此可见基于ART2网络的这些功能,应用ART2神经网络进行信用风险评估相当于人类专家进行信用风险评估的建模过程,而且ART2神经网络与人类专家相比进行的评估更客观、更有效、更精确。最后,ART2神经网络可通过调整警戒线参数 (门限值)来调整模式的类数, 小,模式的类别少(对分类要求粗), 大,模式的类别多(对分类的要求精细),这一点是其他方法无法比拟的,我们可以通过调整 值对输入网络的财务数据进行传统的两级分类(即违约、非违约两类),也可以通过提高 值对输入网络的财务数据进行国际通用的五级分类(即正常、关注、次级、可疑,损失五类)。Altman、Marco和Varetto与意大利银行联合会合作在其经济和金融信息系统中首次进行了将神经网络应用于企业的经济和金融问题诊断的试验,试验的研究结果表明,将企业的财务状况分为正常、关注和次级三类比分为正常和问题两类困难得多,而ART2神经网络却可以通过 值的调整灵活地实现该功能。

综上所述,笔者选择算法复杂的ART2神经网络进行信用风险评估。并且设计了一个自适应共振网络,对信用风险分析进行了实证研究。

3.3基于ART2模型的信用风险分析的实证研究

下面以某国有商业银行提供的90多家企业客户为对象,应用自适应共振理论对这些企业客户的财务数据进行信用风险评估。对于输入到神经网络的财务比率的选择,参照国内财政部考核企业财务状况及国外用于信用风险评估所使用的一些经典财务比率指标,一共挑选出包括企业盈利能力、企业营运效率、企业偿债能力及企业现金流量状况等二十余个指标,考虑到指标间的相关性,利用SAS统计分析软件进行回归分析,得出以下几个比率:

经营现金流量/资产总额(流动性)

保留盈余/资产总额 (增长性)

息税前利润/资产总额 (赢利性)

资产总额/ 总负债 (偿债性)

销售收入/资产总额 (速动性)

某国有商业银行提供的样本数据有90多家企业的财务数据,数据质量不高,有些企业财务数据缺失严重,经过对样本数据的初步审查,删除了不合格的样本40多个,最终得到有效的样本为55个,其中能够偿还贷款的企业34个,不能偿还贷款的企业21个。

评估的准确程度用两类错误来度量,在统计学中,第一类错误称为“拒真”,第二类错误称为“纳伪”。在信用风险评估中把第一类错误定义为把不能偿还贷款的企业误判为能偿还贷款的企业的错误,第二类错误定义为把能够偿还贷款的企业误判为不能偿还贷款的企业的错误。显然,第一类错误比第二类错误严重得多,犯第二类错误至多是损失一笔利息收入,而犯第一类错误则会造成贷款不能收回,形成呆帐。

在应用自适应共振模型进行信用风险评估的同时,笔者也使用了统计方法和经典的BP神经网络模型对同样的样本数据进行了信用风险评估,以便比较验证自适应共振模型的评估准确性。

统计方法使用的是可变类平均法,可变类平均法是由Lance和 Williams(1967)发展的,计算距离的组合公式为:

Djm=(Djk+DjL)(1-b)/2+DkLb (1)

参数b介于0到-1之间,DkL——是类Ck与CL之间的距离或非相似测度。笔者使用SAS统计软件中提供的可变类平均法对样本数据进行了聚类分析。

BP神经网络的结构包括输入层5个节点,用来输入5个财务指标比率,输出层1个节点(取值为1表示能偿还贷款,取值为0表示不能偿还贷款),另外还有一个隐层,隐层包括5个隐节点。网络的有效性采用K组交叉检验的方法进行验证,也就是将样本分为K组,其中K-1组为训练数据,第K组为检验数据,这里将样本数据分为两组,第一组用于训练网络,包括11个违约的企业和16个非违约的企业,第二组作为检验数据,包括10个违约企业,18个非违约企业。该方法使用MATLAB语言编程实现。

ART2模型包括输入层为5个节点,用来输入5个财务指标比率,输出层3个节点,分别表示信用风险的三个级别(正常,关注,可疑),这里应用ART2模型将信用风险分为三个级别有如下几个原因:(1)将信用风险分为三个级别,比前面使用统计方法和BP模型方法将信用风险简单分成两类(违约、非违约)更容易把握风险的程度,更接近实际信用风险评估的需要,也更贴近于国际通用的五级分类标准。(2)通过ART2网络门限值参数的调整可以将信用风险分为国际通用的五级分类标准,这也正是ART2模型的优势所在,但是ART2网络是信用风险分析混合专家系统的组成部分,它的评估结果要作为输入,输入到专家系统中,以便信用风险评估专家系统进行定性及定量的综合评估,考虑到专家系统的规则的数量和知识库的规模对系统执行效率的影响,因此这里将信用风险分为三类。有关专家系统的详细说明,将在下一节讨论。下面给出ART2模型网络的参数设置:a=10,b=10,c=0.1,d=0.9, =0.2, 。由于ART2模型是无教师指导的网络,因此不用训练,直接输入数据,网络自动进行信用风险评估。其中评估的结果:正常、关注两类属于非违约企业,可疑为违约企业。该方法使用C语言编程实现。

下面给出三种方法的最后评估结果见表1

表1 训练样本和测试样本的误判

训练样本 测试样本

第一类错误 第二类错误 总误判 第一类错误 第二类错误 总误判

统计模型 8(38.01%) 9(26.5%) 17(30.9%)

BP模型 2(18.1%) 1(6.1%) 3(11.1%) 3(30.0%) 4(22.2%) 7(25.0%)

ART2模型 4(19.1%) 5(14.7%) 9(16.3%)

通过表1的比较结果可以看出对于统计方法和BP模型自适应共振模型的误判率是最低的,说明了该方法的有效性和可靠性。

另外需要说明的一点是,这里所使用的企业样本数据偏少,而且噪声过多,数据的质量不是很好,这样的数据作为初始数据输入网络对网络的评估的准确性有一定的影响,虽然ART2这种集中注意力可以在混乱的背景中发现目标的特性使得它的评估的准确性比其它两种方法要高,但是笔者相信如果初始输入网络的数据质量再提高一些,网络的误判率会更低。

参考文献:

[1] 张维,李玉霜,商业银行信用风险分析综述,《管理科学学报》[J],1998年第3期,20-27。

[2] 朱明,杨保安,基于知识的银行贷款分类系统,CJCAI2001[C],231-235。

[3] 黄娟,冯玉强,王洪伟,基于联接归纳推理的信贷风险评估集成智能系统,《计算机应用研究》[J],1999年第9期,74-16。

[4] 王春峰,万海晖,张维,商业银行信用风险评估及其实证研究,《管理科学学报》[J],1998年第1期,68-72。

[5](美)约翰.B.考埃特,爱德华.I.爱特曼,保罗.纳拉亚南著,石晓军等译,《演进着的信用风险管理》[M],机械工业出版社,2001。

[6] 李志辉,《现代信用风险量化度量和管理研究》[M],中国金融出版社,2001年。

[7] R.R.Trippi and E.Turban, Neural networks in finance and investing[M], chicago: Irwin professional publishing,1996。

[8] Dick San-Cheong cheung, Kwok-Wa Lam and Sheung-Lun Hung, neural networks for credit scoring model, intrlligent data engineering and learning perspectives on financial engineering and data mining[M], published by Springer,1998,55-62。

[9] Christine Guilfoyle and Judith Jeffcoate, Expert Systems in Banking and Securities[M], published by Ovum Ltd 7Rathbone Street London W1p 1AF England,1990,81-88。

[10] Paul R. Watkins, Expert Systems For use in finance, Applied Expert Systems[M], edited by E. turban and P. R. Watkings, Elsevier Science Publishers B. V., 1998,159-167。

上一篇:用电源自动投入和系统自动恢复装置的研究和实... 下一篇:含节理单元的三维P型自适应有限元解法