基于混合正态分布的风险价值度量

时间:2022-05-25 08:43:06

基于混合正态分布的风险价值度量

摘要:利用参数方法计算VaR的关键在于对收益率分布形式的假定是否合理。为了充分反映金融收益的统计特性,并更好地刻画厚尾特征,本文在利用ARMA-GARCH模型过滤了收益序列的自相关和波动聚类特性后,采用混合正态分布模型分析资产收益的VaR度量,并对上证综指获得的日收益率序列进行了实证研究。比较分析混合正态分布和正态分布两种假定下的VaR。结果表明:混合正态分布假设能够反映收益分布5%的厚尾特征并准确地刻画1%的厚尾部分,避免了正态分布假设低估风险的缺陷,保证了VaR的准确性。

关键词:风险价值;厚尾;ARMA-GARCH模型;混合正态分布

中图分类号:F830 文献标识码:A

文章编号:1000-176X(2009)05-0068-06

一、引 言

金融资产价格的变化可能会使投资者面临很大的潜在损失。为了衡量损失的程度,JP. MORGAN公司率先提出VaR(Value-at-Risk,风险价值或在险价值)方法,并在实践中得到广泛应用,成为金融市场风险测量的主流方法。VaR是在一定置信水平和一定持有期内,某一金融工具或其组合在未来资产价格波动下所面临的最大可能损失。VaR方法的优点是用一个简单易懂的数字即风险价值概括了投资者在金融市场的波动中面临的风险。VaR的计算分为参数方法和非参数方法两种。参数方法是假定投资收益服从某一分布,并采用特定的估计方法估计分布参数,然后,由该分布计算得出VaR。而非参数方法并不假定收益存在某种分布形式,VaR是从经验分布中获得的。非参数方法的缺点是完全依赖于特定的数据集,不能对过去观察不到的数据进行外推,在运用中受到限制。实际中比较常用的是参数方法。

利用参数方法计算VaR的关键在于对收益率分布形式的假定是否合理。大量文献资料和研究已经表明,金融收益数据的尾部集中了大量的概率分布,显现出“厚尾”特性,而不能采用传统的正态分布假定;另外,资产收益序列往往又具有波动聚类现象。如何处理收益的波动聚类并有效地刻画金融资产收益序列的尾部特征,对于提高VaR度量模型的准确度至关重要。

对于波动聚类问题,广义自回归条件异方差模型(GARCH模型)通过假定数据方差项的某种自相关性,提供了收益波动性建模的系统框架,但在该模型中,通常假定收益率残差服从为条件正态分布,而不能刻画收益分布的厚尾特征。虽然对GARCH模型有很多发展和改进(如TARCH、EGARCH等),并可以假定残差服从分布或广义误差分布(GED),但并不能充分而准确地描述实际收益数据的尾部特征,而且在分布的选择上缺乏灵活性和适应性。在分析数据的尾部变化方面,国外很多文献利用极值理论(EVT,Extreme Value Theory)对分布的尾部进行拟合和建模。McNeil[1-2-3]使用极值理论研究了严重损失分布的尾部估计和异方差序列的尾部风险度量;Hans N.E.Bystrom[4]比较分析了分块样本极大值和门限极值理论模型的性能;Danielsson and de Vries[5]比较各种模型的表现情况,认为EVT模型的表现优于参数方法和历史模拟方法;Lee and Saltoglu[6]运用EVT模型对亚洲股票市场进行分析,认为历史模拟法和参数方法比EVT模型表现更好。在国内,田宏伟等[7]研究了极值理论在市场风险度量和在汇率风险价值计算中的应用;朱国庆[8]、田新时[9]等也利用极值理论讨论了上海股市收益的厚尾和风险度量问题。极值理论虽然提供了超越样本的预测能力,但在实际运用中存在很大的缺陷。极值理论是完全基于收益序列尾部特征的,只考虑属于极端值的样本,一方面会使得样本较少,另一方面也忽略了尾部以外的信息。另外,运用极值理论时,阀值的选取对模型也有很大的影响。

研究收益分布的厚尾特征对于衡量潜在损失具有非常重要的意义,而如何设定收益的分布形式,有效地描述和刻画厚尾性对于VaR的计算又存在直接影响。为了充分反映金融收益的统计特性,并更好地捕捉尾部信息,本文结合ARMA-GARCH模型和混合正态分布的假定讨论资产收益的VaR度量。采用混合正态分布刻画厚尾特征,一方面在于尽量减少传统的正态分布等假定带来的模型误设风险,另一方面又保持正态分布比较方便的特征。

二、VaR方法

VaR是在一定的置信水平下和一定的目标期间内,某金融工具或投资组合可能出现的最大损失(或最坏情况下的损失)。如果用r表示资产的日收益率,并假定其分布为f(r),则对于选定的置信水平α,VaR可以表示为:

∫-VaR-∞f(r)dr=1-α(1)

VaR实际上是在一定的目标期间内,收益分布对应于尾部水平(1-α)的分位数。例如,置信水平选取α=95%,则VaR就是收益分布的5%分位数,具体可以描述为:损失的水平在95%的置信水平下不会超过这个数值。

VaR方法准确地给出了风险的大小,是一个非常有用的概括风险的方法,但VaR只是预期损失将以概率(1-α)超过VaR值,而并没有给出对损失的具体描述。为了分析损失的程度,引入条件VaR来度量在损失超过VaR值时损失的期望值,用公式表示为:

ES=-E(r|r≤-VaR) (2)

三、ARMA-GARCH模型

对收益率序列r,通常采用ARMA模型分析序列的自相关性。ARMA模型的形式为:

rt=μ+∑pi=1φirt-i+ut-∑qj=1θiut-i(3)

其中,{ut}是均值为0、方差为σ2的白噪声序列。ARMA模型中关于ut是白噪声序列的假定,使得模型无法有效解释收益序列中经常观察到的波动聚类现象,因此,在ARMA模型中进一步引入GARCH效应对波动性建模,本文采用通常使用的GARCH(1,1)模型,其形式为:

ut=σtεt, σ2t=ω+αu2t-1+βσ2t-1 (4)

其中,ω>0,α≥0,β≤1,α+β<1。{εt}是一个均值为0、方差为1的独立同分布残差序列,通常假定为标准正态分布或标准化的学生t分布。从GARCH(1,1)模型的表达式可以看出,如果u2t-1或σ2t-1较大,则σ2t较大,这意味着大的u2t-1会紧跟着另一个大的u2t,因此,模型有效地描述了序列中存在的波动聚类现象。为了提高GARCH模型在尾部的能力,可以将标准正态分布假定替换为t分布假定。不过,最近关于时间序列的经验研究显示GARCH模型的尾部太薄,即使是假设εt服从t分布的GARCH模型,可能也并不适合描述实际数据的尾部。

四、混合正态分布

ARMA-GARCH模型过滤之后得到残差序列{εt:εt=ut/σt}是独立同分布随机变量,但传统上对残差服从标准正态分布或标准化t分布的假定并不能很好地描述分布的尾部特征。为了使分布假设更合理,同时又充分反映收益的统计特性,避免极值理论中只关注极端值的情况,采用混合正态分布方法有很好的实用价值,它在保持正态分布比较方便的基础上能够刻画数据的厚尾特性。

混合正态分布的概率密度是几个正态概率密度的线性组合。假定{εt}服从混合正态分布,则其概率密度为:

f(ε|θ)=∑kj=1pjfj(ε)(5)

其中,pj≥0且∑kj=1pj=1;fj(ε)为正态分布N(μj,σ2j)的密度函数,j=1,…,k,并假设k个正态分布之间是独立的;θ=(μ1,…,μk,σ21,…,σ2k,p1,…,pk)为混合正态分布的参数。如果对样本容量为t的数据序列引入缺失数据的隐变量z=(zij),i=1,…,t;j=1,…,k,其中zij的取值为:当第i个样本来自于混合分布的第j个正态分量时,令zij=1,否则zij=0,则结合式(5)可知,f(εi|zij=1)=fj(ε),f(zij=1|p)=pj。因此,在混合正态分布中,各样本值均由k个正态分布中某一个正态分布的统计特性所决定,或者说,各样本值均来源于k个正态分布中的某一个分布。参数θ中的p1,…,pk反映了样本来源于各个正态分布的概率;而μ1,…,μk,σ21,…,σ2k决定k个正态分布的统计特性。

金融资产收益率在过滤了自相关和波动聚类之后,在大部分“正常的”时间里可近似认为服从标准正态分布,而在“异常的”时间可能是来源于一个具有较大方差的正态分布。金融资产收益率具有厚尾特性而不能用正态分布来描述的原因可能也正是因为收益具有的“异常”特性,这种异常往往会给投资者带来比预期更大的损失。基于上述思想,采用混合正态分布拟合ARMA-GARCH过滤之后的残差,不仅可以充分描述收益的统计特性,而且可以反映收益的厚尾特征。为了直观地说明混合正态分布对厚尾的描述,以下考虑两个正态分布混合下的情况,表1给出了混合正态分布的参数设置以及分布的统计特性。从表1中可以看出,3个分布的均值和偏度均为0;εB和εC的标准差和峰度均大于εA,而且εB和εC的峰度远远大于3。εA实际上服从标准正态分布N(0,1),这说明εB和εC相对于正态分布εA显示出尖峰的特征。通过混合正态分布εB、εC分别与均值、方差相同的正态分布的尾部放大对比,可以看出:相对于正态分布而言,εB、εC的左尾现象非常明显。这在一定程度上表明,混合正态分布这一假设,在保持正态分布特征的基础上,通过赋予各正态分量合适的参数以及适当的比例,可以用于描绘和刻画序列的尾部特征。

图1 混合正态分布与均值方差相同的正态分布尾部放大对比图

假定独立同分布的标准化残差服从混合正态分布时,分布参数θ按照极大似然估计方法求参数是很困难的。极大似然估计在计算方面的复杂程度依赖于似然函数的形式,而混合正态分布的似然函数根据式(5)可得:

f(ε1……εt|θ)=∏ti=1f(ε|θ)=∏ti=112π∑kj=1pjσjexp-(εi-μj)22σ2j (6)

极大似然估计的计算很复杂,无法利用解析方法获得参数的估计值。由于在引入隐变量z后,f(zij|p)事实上是一个多项分布Multinomial(1,p),因此,在实际中,参数估计常采用EM算法或贝叶斯方法。

五、实证分析

本文利用上证综指获得的收益率序列rt作为样本计算收益率的VaR。由于中国股市从1996年12月16日起实行涨跌停板交易制度,为了提高模型的精度,减少极端异常值的干扰,样本期间取为1996年12月16日至2008年11月11日,样本数量为2 874个,数据来源于CCER经济金融研究数据库。实证分析的过程是先用ARMA-GARCH模型对收益率序列rt分离相关性和波动聚类特征,通过过滤得到近似独立同分布的残差序列εt;然后假设残差εt服从混合正态分布,并计算该分布的VaR和ES值;最后计算收益率序列rt的VaR和ES值。

1. 收益率序列的统计特性及ARMA-GARCH模型

在考察的样本期间内,收益率集中在(-0.1,0.1)之间,具体的描述统计以及正态性检验结果如表2所示。

表2 收益率数据的描述统计和正态性检验结果

平均值

标准差

中位数

最大值

最小值

0.000371

0.017454

0.000498

0.098570

-0.094441

偏 度

峰 度

Jarque-Bera检验

-0.050992

7.788802

统计量=2 747.427,P = 0.000000

Jarque-Bera正态性检验(又称为峰度-偏度检验)结果表明,收益率序列rt显著异于正态分布。图1绘制了收益率的核密度图以及假定收益率服从正态分布时的概率密度图,从图1中可以看出,收益率序列存在明显的尖峰厚尾现象,特别是左尾是很明显的,这表明,收益率在负值时异常值出现的概率更大。

图1 收益率的核密度图和正态分布假设下的概率密度图

进一步采用Augmented Dikey-Fuller方法对收益率进行单位根检验,t统计量为-54.79,小于显著性水平1%的Mackinnon临界值-3.43,因而拒绝单位根假设,即收益率序列rt是平稳的,可以用ARMA模型分析序列可能存在的自相关问题。相关计算表明,直至滞后36期,rt序列的自相关系数最大仅为0.079,基本上不存在明显的自相关现象,ARMA模型简化为rt=0.000371+μt;而考察r2t序列的自相关结构时,表明r2t序列存在相关性,说明序列rt可能存在ARCH效应。对是否真实存在ARCH效应, LM检验的结果表明,当选择滞后阶数为3时,相伴概率P=0,即rt序列存在ARCH效应。由于日收益率序列rt只是存在ARCH效应,因此,ARMA-GARCH模型简化为:

rt=μ+ut, ut=σtεt, εt~iid(0,1)

σ2t=ω+αu2t-1+βσ2t-1(7)

在上述模型中,如果假定残差εt为标准正态分布,利用准极大似然估计(QML)方法并结合模型参数的显著性检验,模型的估计结果为:

σ2t=4.637995×10-6+0.110810u2t-1+0.880523σ2t-1(8)

为了检验模型的效果,对标准化的残差序列εt进行LM检验。结果表明,在滞后3阶的情况下,相伴概率为0.73,表明序列εt已不存在ARCH效应。进一步计算εt序列和ε2t序列的自相关和偏相关系数,计算结果均接近于0,表明残差序列εt不存在ARCH效应,也不存在自相关现象。因此,可以认为标准化残差序列εt是独立同分布序列。

2.残差序列εt的混合正态分布假设

如果模型(7)、(8)的设定是正确的,那么在正态分布假设下,ARMA-GARCH模型过滤后得到的标准化残差εt序列应服从标准正态分布。然而通过表3中关于εt序列的描述统计和正态性检验数据可以看出,虽然序列的平均值和标准差均接近标准正态分布,但是峰度值却显著大于3,表明序列存在尖峰现象。

进一步从图2中残差数据的核密度图和标准正态分布的概率密度图中可以看出,残差序列存在明显的尖峰厚尾现象。这表明经过ARMA-GARCH模型过滤后,残差序列εt依然存在厚尾现象,残差服从标准正态分布的假设并不合理。

图2 残差数据的核密度图和标准正态分布的概率密度图

本文假定标准化残差服从混合正态分布,分布参数的估计值及标准误差如表4所示。对分布的估计结果进行秩和检验,统计量为83.123,P值为 0.015,表明在0.01的水平下不能拒绝分布假设。拟合的混合正态分布其均值为0.0111,均方差为1.0017,峰度为5.1600,都接近于残差序列相应的统计值。

图3给出了残差数据在混合正态分布和正态分布两种拟合下的对比图,从图3中可以看出,相对于正态分布,混合正态分布不仅能充分反映出序列的统计特性,而且能够刻画序列的尾部特征。从混合正态分布的参数值可以看出,数据来源于正态分布N(0.049137,0.706401)的概率约为73%;而来源于正态分布N(-0.093617,1.542316)的概率约为26%。

图3 残差数据在两种分布假设下拟合的对比图

3.VaR的计算结果及检验

以下计算并比较在混合正态分布和正态分布两种假设下的VaR,其中,置信水平取α=99%和α=95%两种情况。

由式(1)计算混合正态分布和正态分布的VaR和ES,结果如表5所示。从表5中可以看出,混合正态分布在99%置信水平下的VaR和ES均明显大于正态分布的相应值,这正是由于混合正态分布考虑了数据的尾部特征。在95%的置信水平下,两种分布的VaR和ES相对来说比较接近,表明对于该例数据,混合正态分布更关注1%的厚尾。

由以上计算得到的残差VaR和ES,结合GARCH模型(7)、(8)式得到的条件标准差σt,将εt的VaR和ES分别代入表达式rt=σtεt,则可以获得收益率序列rt的动态VaR和ES估计序列。表6给出了对应于两种分布假设、收益率rt在99%和95%置信水平下VaR和ES的统计结果。从表6中也可以看出,混合正态分布假设下收益率在99%置信水平的VaR和ES均明显大于正态分布假设的相应值,而两种分布假设下95%置信水平的VaR和ES比较接近,这也正是由于针对给定的收益率样本,混合正态分布更关注收益率1%的厚尾。

VaR的准确性可以采用基于失效率的检验方法进行评估。对于给定时间窗口T下的T个样本,如果定义失效率N为样本值超过VaR的个数,即异常样本的个数,那么在T较大时,N应趋近于T(1-α),其中α为置信水平。对于T天的动态VaR,通过比较异常个数N的理论值和实际值,可以初步判断VaR的准确性。进一步采用Kupiec[10]提供的方法,构建对数似然比统计量:

LR=-2ln[(1-α)T-NαΝ]+2ln[(1-N/T)T-N(N/T)N](9)

如果LR>3.84,则认为(1-α)并不是样本值超过VaR的真实概率,即VaR与设定的置信水平α并不对应。表7给出了不同时间窗口T的各种VaR类型中异常个数的理论值、实际值和统计量。从表7中可以看出,当置信水平为95%时,实际观察到的值在两种分布假设下均非常接近或等于理论值,而且统计量均小于3.84。这说明两种分布假设都能描述5%的厚尾部分。然而,当置信水平为99%时,正态分布假设下的实际值明显大于混合正态分布假设,统计量也出现大于3.84的情况,而混合正态分布假设下的值接近于理论值,统计量也都小于3.84。这说明混合正态分布假设更适合描述分布的厚尾特征,能够准确刻画1%的厚尾部分,而正态分布假设在1%的尾部上大大低估了风险。

表7各种VaR类型中异常个数的理论值、实际值和统计量

VaR类型

时间窗口T下,异常个数的实际值(理论值)

六、结 论

利用参数方法计算VaR的关键在于对收益率分布形式的假定是否合理。为了充分反映金融收益的统计特性,并更好地刻画厚尾特征,本文在利用ARMA-GARCH模型过滤了收益序列的自相关和波动聚类特性后,采用混合正态分布模型分析资产收益的VaR度量,并对上证综指获得的日收益率序列进行了实证研究。研究表明,即使是过滤了自相关和异方差效应,日收益率序列仍然存在厚尾现象,并不服从传统的正态分布,而混合正态分布假设能够反映收益分布5%的厚尾特征并准确地刻画1%的厚尾部分,避免了正态分布假设低估风险的缺陷,保证了VaR的准确性。应当指出的是,本文假定混合分布的参数在样本期间为常数,如果能够判断出收益序列或金融数据在不同时期存在显著的变化,则应当考虑分布参数的可变性。

参考文献:

[1] McNeil, A.J. Estimating the Tails of Loss Severity Distributions Using Extreme Value Theory[J]. ASTIN Bulletin,1997,(27):117-137.

[2] McNeil, A.J. Extreme Value Theory for Risk Managers[M].Internal Modeling and CAD. Risk Book,1999.

[3] McNeil, A.J. Estimation of Tail-related Risk Measures for Heteroscedastic Financial Time Series:An Extreme Value Approach[J]. Journal of Empirical Finance,2000,(7):271-300.

[4] Hans N.E.Bystrom. Managing Extreme Risk in Tranquil and Volatile Markets Using Conditional Extreme Value Theory[J]. International Review of Financial Analysis,2004,(13):133-152.

[5] Danielsson J.,C.G.de Vries. Value at Risk and Extreme Returns, London School of Economics[J].Financial Markets Group Discussion Paper,1997,(273).

[6] Lee, Saltoglu. Assessing the Risk Forecasts for Japan[J]. Japan and the World Economy, 2002,14(1):63-87.

[7] 田宏伟,詹原瑞,邱军. 极值理论(EVT)方法用于受险价值(VaR)计算的实证比较与分析[J]. 系统工程理论与实践,2000,(10).

[8] 朱国庆,张维. 关于上海股市收益厚尾性的实证研究[J].系统工程理论与实践,2001,(4).

[9] 田新时,郭海燕. 极值理论在风险度量中的应用――基于上证180指数[J].运筹与管理,2004,(1).

[10] Kupiec, Paul. H.Techniques for Verifying the Accuracy of Measurement Models[J].Journal of Derivatives,1995,(3):73-80.

[11] 菲利普•乔瑞(Philippe Jorion).风险价值VaR[M].陈跃,等译,北京:中信出版社,2004.10.

[12] Ruey S.Tsay. 金融时间序列分析[M]. 潘家柱译,北京:机械工业出版社,2006.4.

[13] 詹姆斯 D.汉密尔顿. 时间序列分析[M]. 刘志明译,北京:中国社会科学出版社,1999.12.

[14] Clark. A Subordinated Stochastic Process Model with Finite Variance for Speculative Prices[J].Econometrica,1973,(1):135-155.

[15] Zangari, P.An Improved Methodology for Measuring VAR, RiskMetrics Monitor[M].Reuters/JP Morgan, Second quarter,1996.

[16] Venkataraman, S.Value at Risk for a Mixture of Normal Distributions: The Use of Quasi-Bayesian Estimation Technique[J].Economic Perspectives, Federal Reserve Bank of Chicago, March/April,1997,21(2):2-13.(责任编辑:于振荣)

VaR Measures Based on Mixture of Normal Distributions

Abstract: In order to describe the statistic character and account for the characteristic of fat tails of return series, this paper focuses on the VaR analysis for fat-tailed financial returns based on mixture of normal distributions combined with ARMA―GARCH Model. We firstly build an ARMA-GARCH Model to fit the correlationship and volatility clustering of return series, then we propose the statistical models of mixture of normal distributions to estimate VaR and ES instead of normal distribution. The empirical study of the return series of Shanghai stock index shows that mixtures of normal distributions can well fit the return series and performs well on one percent of the distribution’s tail. Comparing with normal distribution, mixtures of normal distributions can model fat tails while preserving some convenient characteristics of normal distribution and enhance the accuracy of VaR.

Key words: Value-at-Risk (VaR); fat tails; ARMA-GARCH model; mixture of normal distributions

上一篇:股票价格对上市公司绩效的影响 下一篇:政府投资项目代建制关键治理因子研究