基于支持向量机的商业银行信用风险评估

时间:2022-10-26 07:58:52

基于支持向量机的商业银行信用风险评估

【摘 要】随着对银行利率市场化呼声的不断加强,商业银行自身信用风险问题日益突出。在更加激烈的竞争环境下,我国商业银行尤其是国有银行必将逐渐失去其原有的垄断地位,面临更大的信用风险。而目前,我国商业银行仍存在信用风险管理体系不健全、信用风险评估方法落后等隐患,因此对信用风险进行科学评估成为我国商业银行信用风险管理的关键。针对这一问题,本文遵循《新巴塞尔资本协议》的核心思想,引入支持向量机(Support Vector Machine,SVM)和BP(Back Propagation)神经网络,构建了一套商业银行信用风险评估模型。

【关键词】支持向量机;信用风险;ν-SVR;BP神经网络;贷款违约

1.引言

信用风险自古有之,是整个金融界所一直关注的热点问题之一。随着经济一体化和金融全球化步伐的加快,商业银行正处在一个更加复杂的金融环境当中。在这样的背景下,商业银行的风险逐渐由单一化演变为多元化,其经营管理中所面临的风险也必然随之增加。这些风险可以归结为信用风险、操作风险、市场风险等。这其中,最为重要的风险就是信用风险。广义的信用风险主要包括信贷风险和流动性风险等。信贷风险是指银行承担借款方可能违约而导致贷款无法收回的风险;而流动性风险是指银行自有资金不足,从而可能无法满足其存款人或其他债权人的资金索取而导致违约的风险,属于银行自身的信用风险。

基于《新巴塞尔资本协议》中提出的对资本充足率的要求,监管机构对于银行自身信用风险的控制进一步得到强化,银行管理者对于信用风险的防范意识也在逐步增强。改革开放以来,我国商业银行信用风险的内部监管制度正逐步建立。然而,由于金融体系建立较晚,我国金融市场的完善程度相对于发达国家来说仍处于落后地位。

目前,国家加快了发展市场经济的步伐,随着总理在2011年4月份的国务院常务会议中提出深化金融体制改革以来,打破国有商业银行垄断、推进利率市场化已经摆上了历史日程。利率市场化将逐步打破我国商业银行在融资体系中的垄断地位,使得商业银行将面临更大的竞争压力,承受更多的信用风险。

因此,鉴于日益突出的商业银行自身信用风险问题,建立一套有效合理的信用风险评价模型,对其进行科学评估已经成为信用风险管理的核心。然而,目前我国商业银行信用风险管理现状却令人担忧,表现在信用风险管理体系不健全、信用风险评估模型方法落后等。这就迫切需要为我国商业银行信用风险分析研究提供思路,构建一套符合我国商业银行客观需要的信用风险评估指标体系,建立可以准确衡量信用风险的模型,以用来填补我国商业银行在信用风险管理上的不足。

目前,国际上最具影响力的信用风险模型主要有KMV公司的KMV模型、J.P摩根公司的Credit Metrics模型以及麦肯锡公司的Credit Portfolio View模型。这些模型在国外的商业银行中已经得到了广泛应用,并且取得了较好的风险预测效果。然而,由于我国上市商业银行样本数量偏少以及反映信用状况的相关有效数据缺失等原因,导致这些模型无法在我国商业银行信用风险评估领域得到有效的应用[1]。

因此,针对我国上市商业银行信用风险的以上特点,本文将尝试引入支持向量机这种小样本学习算法,通过对银行关键信贷财务指标的研究,以期建立一套可以对我国商业银行自身信用风险状况进行评估的模型。模型以银行总体的贷款违约率作为评估商业银行信用风险状况的指标,采用支持向量回归机中较为前沿的分支模型 ,对样本数据进行训练,并与经典支持向量回归机模型和BP神经网络模型进行对比,研究各个模型在风险预测分析方面的表现。同时,对我国商业银行未来的贷款违约率进行预测,以此作为评估其信用风险大小的标准,对所有银行的风险进行排序。最后根据分析结果对银行的信用风险管理提出意见和建议,以期对我国商业银行风险管理提供参考。

2.研究内容及研究方法

2.1 研究内容

以商业银行信贷风险度量及管理的基本理论为基础[2],本文将尝试引入统计学习理论中的支持向量机模型,通过对银行关键信贷财务指标进行研究,以期建立一套可以对我国商业银行自身信用风险状况进行评估的模型。同时,本文将对支持向量机不同的分支模型和其他的系统学习算法进行对比,检验不同模型在风险评估中的准确性以及对风险的可预测性,以此研究各个模型在风险预测分析方面的表现。得出在风险评估预测方面最优模型之后,本文利用训练效果最好的模型,对我国商业银行未来的贷款违约率进行预测,以此作为评估其信用风险大小的标准,对所有银行的风险进行排序。最后根据分析结果对银行的信用风险管理提出意见和建议,以期对我国商业银行风险管理提供参考。

2.2 研究方法

结合《新巴塞尔协议》的内容和目前我国上市商业银行的经营状况,本文将对我国商业银行的信用风险成因进行分析,选取与银行自身信用风险状况密切相关的关键信贷财务指标,以银行整体的贷款违约率作为衡量信用风险的依据,构建一个可以用来分析信用风险的财务指标体系。采用正向化处理和主成分分析的方法对原始财务数据进行线性降维和特征提取的预处理,并将当年的财务数据与第二年的贷款违约率进行对应匹配的处理,以此作为模型的训练样本。

在对银行财务数据进行预处理的基础上,本文引入支持向量回归机中较为前沿的分支模型、经典支持向量回归机模型 以及同来源于学习算法的BP神经网络模型对样本数据进行训练。同时,将三种模型分别采用遍历搜索的方法进行优化训练:对模型选取一个比较适用的Kernel核函数以及参数、和核函数中的参数;对于模型,选取一个比较适用的Kernel核函数以及参数、和核函数中的参数;而对于BP神经网络模型,选取输入层到隐含层以及隐含层到输出层的节点转移函数,并且挑选出适合的训练函数和网络学习函数,再用计算机筛选出最佳的隐含层节点的个数。

确定最优参数以及模型结构以后,本文采用已经分别最优化的三种训练模型,将样本输入到模型中进行训练,并对各个模型的训练和预测效果进行对比分析,选取出其中训练和预测精度最高的一种模型,以此来构建适合我国商业银行自身信用风险评估的度量模型。

本文最后将采用构建出的商业银行自身信用风险度量模型,结合所有中国上市商业银行近期的财务数据,对其衡量信用风险的未来贷款违约率进行预测,以此作为评估其信用风险大小的标准,对所有银行的风险进行排序。

本文的模型在训练过程中采用计算机仿真的技术,主要运用Matlab、SPSS和EXCEL等建模和统计软件对数据进行分析处理和训练。

网络学习过程包括信息正向的传播和误差的反向传播两个步骤,其模型结构如图1所示:

图1 BP神经网络结构图

由图1所得,在信息正向的传播过程中,样本从输入层输入,经过隐含层,经过连接权值和阀值的作用得到输出值,并与期望输出值进行比较。若有误差,则误差沿着原路反向传播,通过逐层修改权值和阀值。如此循环,直到输出结果符合精度要求为止。

除了激发函数、训练函数和学习规则外,BP神经网络的训练过程还需要设定隐含层神经元个数、学习度和最大训练迭代次数三个参数。其中,隐含层神经元个数可以凭经验决定,个数过少将影响网络的学习能力,而过多的神经元个数将大幅增加网络学习的时间;而参数学习度越小,将导致训练次数越多,但学习率过大,将影响网络结构的稳定性;最后,最大训练迭代次数由前两者共同决定,三者共同影响网络学习的效率。为了将BP神经网络达到最优的训练效果,本文在实证研究中对各个参数进行遍历搜索,以期筛选出可以互相配合、使得模型达到具有最佳训练效率的一组参数。

3.实证分析

本部分引入支持向量机和BP神经网络,建立商业银行自身信用风险评估指标体系,以我国上市商业银行的数据为样本进行训练,筛选出最优风险预测评估模型。

如表1所示,本文对商业银行的13个关键信贷财务指标提取出6个主成分,分别为盈利能力、经营能力、资本结构、流动性、资本充足性和安全性。其中,表格右侧一栏表示每个财务指标对于商业银行信用风险的作用方向,“+”代表减少信用风险的指标,“-”代表增加信用风险的指标。

上文通过将样本分别输入模型、模型以及BP神经网络(BPN)模型进行训练,并分别对模型进行了优化设计。根据以上得出的三种最优化的训练模型,再分别输入我国商业银行2007年、2008年和2009年三年的财务数据,模拟计算出2008年、2009年和2010年的贷款违约率,并与各银行当年实际的贷款违约率进行比较,以此分析模型对训练样本的检测结果。模型对商业银行2008年的贷款违约率的检测效果如表2和图2所示:

分析表3至表4三年贷款违约率的检验效果,可以得出模型的训练效果优于模型和BP神经网络模型,即模型每年对贷款违约率的拟合效果较好,检测精度较高。为了进一步验证本文的结论,选取商业银行实际贷款违约率和检验值之间的相关系数和均方误差(Mean Squared Errors,MSE)对三个模型的检测效果进行综合评判,结果如表5所示:

表5 模型检验效果的评判结果

从表5可以看出,模型的训练效果无论在相关系数和均方误差MSE的检验上均优于另外两种模型。因此,可以得出模型在商业银行信用风险的训练中具有最优的检验效果。

除了对模型的样本检验效果分析外,本文再对最优化后的模型进行预测效果的评价。具体地,输入2010年的财务指标,预测出2011年各商业银行的贷款违约率,并与实际的贷款违约率进行比较,以此判断模型的预测效果,结果如表6所示:

从上表7可以看出,模型的预测效果无论在相关系数和均方误差MSE的检验上均优于另外两种模型,并且预测出的贷款违约率与实际的贷款违约率之间的相关系数超过了0.95,具有比较精确的预测能力。因此,在对商业银行信用风险评估中,模型具有更高的评测精度和较小的预测误差,是一种更为科学合理的评估方法,可以为商业银行的信用风险管理提供新的参考。

4.结论

支持向量机是一种基于小样本学习理论的通用学习算法,具有严格的理论基础,能较好地解决小样本、非线性、高维数和局部极小点等实际问题。经过多年的发展,支持向量机已经衍生出多种改良形式和优化模型。其中,模型是一类具有较高预测精度的支持向量回归机,在多个领域已经得到了广泛的应用,取得了较好的预测效果。

针对于目前我国商业银行信用风险管理体系的不足以及国内上市商业银行的样本数量偏少的情况,本文引入了模型来评估商业银行自身的信用风险。利用主成分分析建立商业银行信用风险评估指标体系,并构建基于模型的商业银行信用风险评估模型。通过与模型和BP神经网络模型训练效果的比较,发现模型在商业银行信用风险的训练和预测中都具有更高的精度。

本文最后根据优化训练完毕的模型对我国所有上市商业银行未来的信用风险进行了预测,得到了我国商业银行整体信用风险可能上升,并且国有银行和股份制商业银行都将面临更大信用风险的结论。因此,根据以上的分析,模型为商业银行的信用风险管理提供了更为有力的辅助工具,可以推广到更多金融领域的风险评估当中。

尽管本文从模型的优化设计、训练样本的匹配选取以及银行自身信用风险的度量角度三个方面对我国商业银行信用风险的评估研究做了一些开创性的工作,取得一定的研究成果,但还存在需要进一步完善和深入研究的问题,这些问题主要是:

(1)本文所引入的模型的算法可以与交叉验证和选块、分解等方法配合使用,改进模型中对于参数优化设计的步骤和思想,以此可以改良原有模型的算法,进一步提高模型对商业银行信用风险的预测精度;

(2)对于建立起的商业银行信用风险评估指标体系,应该结合我国商业银行实际面临的信用风险结构以及资产配置状况进行调整,并且可以根据不同类型的银行分别采用不同的信用风险评估指标体系,以此针对不同银行构建起更加合理的信用风险评估模型。

参考文献:

[1]曹道胜,何明升.商业银行信用风险模型的比较及其借鉴[J].金融研究,2006(10):90-97.

[2]Cortes C,Vapnik V N.Support-Vector Networks[J].Machine Learning,1995,20(3):273-297.

[3]Vapnik V N,Lerner A.Pattern Recognition Using Generalized Portrait Method[J].Automation and Remote Control,1963,24:774-780.

[4]Drucker H,Burges C J C,Kaufman L,Smola A,Vapnik V.Support vector regression machines[J].Electronic Engineering,1997,1(6):155-161.

[5]Sch?lkopf B,Williamson R C,Bartlett P L.New support vector algorithms[J].Neural Computation,2000,12(5):1207-1245.

[6]Sch?lkopf B,Smola A J.Learning with kernels:support vector machines,regularization,optimization,and beyond[M].Cambridge:MIT Press,2002.

[7]Wang Defeng,Yeung D S,Tsang E C.Weighted Mahalanobis Distance Kernels for Support Vector Machines[J].IEEE Trans on Neural Networks,2007,18(5):1453-1462.

[8]Tay F E H,Cao L.Application of Support Vector Machines in Financial Time Series Forecasting[J].Omega,2001,29(4):309-317.

[9]Vapnik V N.统计学习理论的本质[M].张学工译.北京:清华大学出版社,2000.

[10]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.

[11]邓乃扬,田英杰.支持向量机——理论、算法与拓展[M].北京:科学出版社,2009.

[12]顾亚祥,丁世飞.支持向量机研究进展[J].自动化学报,2011,38(2):14-17.

[13]刘建伟,李双成,罗雄麟.P范数正则化支持向量机分类算法[J].自动化学报,2012,38(1):

76-87.

[14]李倩,郑丕谔.基于支持向量机的企业现金流量评级[J].内蒙古农业大学学报(社会科学版),2007,9(6):86-87,93.

[15]吴冲,夏晗.基于支持向量机集成的电子商务环境下客户信用评估模型研究[J].中国管理科学,2008,16(S1):362-367.

[16]李翀,夏鹏.后验概率支持向量机在企业信用评级[J].计算机仿真,2008,25(5):256-258.

[17]余晨曦,梁潇.基于支持向量机的商业银行信用风险度量模型[J].计算机与数字工程,2008,36(11):10-14.

[18]孙彬,李铁克.基于v-SVR的金融股指预测及选时策略研究[J].统计与决策,2010,38(3):

45-48.

[19]胡海青,黄铎,武晟.基于SVM的股份制商业银行利益相关者对资本配置绩效影响的仿真研究[J].管理工程学报,2010,24(4):148-154.

[20]约翰·赫尔.风险管理与金融机构[M].北京:机械工业出版社,2010,2.

[21]Shawe-Taylor J,Cristianini N.Kernel Methods for Pattern Analysis[M].New York:Cambridge University Press,2004.

[22]Rumelhart D E,Hinton G E,Williams R J.Learning Representations by Back-propagating Errors[J].Nature,1986,323(6088):533-536.

[23]孙继伟.我国商业银行风险评价指标体系研究[D].上海:复旦大学,2011.

上一篇:浅谈银银合作业务的风险防控 下一篇:农村公共产品的融资机制研究