可变精度粗糙集在上市公司财务预警中的运用

时间:2022-09-21 04:15:28

可变精度粗糙集在上市公司财务预警中的运用

【摘要】 可变精度粗糙集VPRS是标准粗糙集RS的一种推广。文章借鉴了VPRS模型具有噪声数据的强适应能力和强抗干扰能力的优点,提出了一类基于VPRS的信息产业上市公司财务预警方法,并用部分信息产业上市公司对其进行实证检验。检验结果表明:该方法具有较好的识别能力,对信息产业上市公司财务危机的预测准确率达到89.7%,具有良好的应用前景。

【关键词】 信息产业; 财务预警; 可变精度粗糙集; R约简; 决策树

一、引言

改革开放以来,我国信息产业发展迅速,已逐步成为国民经济重要的支柱性、先导性、基础性和战略性产业。信息产业类企业,包括致力于信息技术研发和服务的企业,具有较强的扩张性、渗透性,资金需求量大,但由于受到信息技术生命周期、研发成熟度、市场容量、经营能力等因素的影响,其未来发展和经营业绩具有较大的不确定性,导致企业面临较大的经营风险和财务风险。其中,信息产业上市公司的财务信息对多方利益相关者都有着重要影响。因此,建立财务预警系统、强化财务管理、避免财务失败和破产,具有重要意义。

现有的企业财务预警方法可分为定性预警与定量预警两类。定性分析主要包括:灾害理论、专家调查法、四阶段症状等方法。定量分析主要包括:单变量判定模型、多变量线性判定模型、Logistic回归模型、人工神经网络模型等方法。上述方法各有其特点,但均存在不同程度的局限,难以满足企业财务预警实践发展的需要。粗糙集(RS)是一种刻画不完整性和不确定性的数学工具,能有效分析不精确、不一致、不完整等各种不完备信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,从而有效进行知识库的约简和规则的提取。

可变精度粗糙集(VPRS)是对RS理论的扩充,它在标准粗糙集的基础上引进一个阈值β,并将其定义为错误分类率(0≤β<0.5),即允许一定程度上错误分类率的存在,由此,使VPRS具有较强的抗干扰能力。An等(1996)又将β定义为正确分类率(0.5≤β<1),并称之为强化粗糙集。文献[6]运用VPRS模型对我国166家上市公司财务困境进行预测,取得了较高的预测精度。文献[7]显示VPRS模型在应用过程中面临参数β的选择问题,不同的β值将产生不同的属性约简结果。有鉴于此,本文将VPRS引入到信息产业上市公司财务预警分析中,提出一种基于VPRS的信息产业上市公司财务预警方法。首先,根据VPRS模型对属性进行R约简并生成识别规则,形成识别规则库;然后,在识别规则库的基础上集成剪枝决策树,构建信息产业上市公司财务危机识别方法;最后,利用测试样本对识别方法进行检验并获取识别精度。结果显示,该方法对信息产业上市公司财务危机的预测准确率达到89.7%,具有良好的应用前景。

二、基于VPRS的信息产业上市公司财务预警方法

步骤1:建立决策数据表,对原始数据进行补缺。使用决策表来描述对象,即采用二维数据关系表的形式。表中每一行描述一个对象(即样本企业),每一列描述对象的一种属性。在实际收集数据的过程中,不可避免地会遇到数据缺失情况。为此,拟采用Mean/mode方法对数据进行补缺。

步骤2:对样本数据进行划分及离散化处理。按2∶1的比例将完备数据关系表划分为两个数据关系表,其中,总样本的67%为训练样本,用来导出识别规则,形成识别规则库;剩余的33%为测试样本,用来检验识别方法,获取识别精度。运用VPRS模型处理数据关系表时,要求表中的属性值用离散数据表示,而大部分样本企业的条件属性均为连续值,因此,必须对样本数据进行离散化处理。拟采用等频率划分方法对数据进行离散化处理。

步骤3:R约简与规则生成。VPRS模型常用的属性约简算法有:R约简、上下分布约简等。其中,R约简是通过全局增益来度量决策信息系统的属性重要程度,并以全局增益作为启发式信息得出VPRS属性约简的启发式算法。本文拟采用R约简,通过启发式算法对训练样本进行属性约简。根据约简结果,生成具有一定决策概率的不精确决策规则。通过设定相关的可信度、覆盖率、支持数阈值,对生成的规则进行筛选,形成识别规则库。

步骤4:集成剪枝决策树,构建信息产业上市公司财务危机识别方法,并对其进行检验。首先,在识别规则库的基础上,运用基于VPRS的决策树生成方法,建立基于识别规则的决策树。即通过计算各规则的变精度明确区,选取明确区最大的规则作为第1条规则,用第1条规则对待识别样本进行识别;其次用第2条规则对第1条规则不能识别的剩余样本进行识别,以此类推;再次,运用基于RS的决策树剪枝算法得到剪枝决策树,从而构建起信息产业上市公司财务危机识别方法;最后,利用测试样本对识别方法进行检验,获取识别精度。

三、实证分析

(一)指标体系和样本数据

本文参考国内外有关文献提出的企业财务预警指标体系,遵循指标选取的系统性、科学性及可操作性等原则,从偿债能力、营运能力、盈利能力等五个方面,选取流动比率、速动比率、资产负债率、利润总额、财务费用、已获利息倍数、存货周转率、应收账款周转率、净资产收益率等21项财务指标建立信息产业上市公司财务预警指标体系。

选取沪、深股市中有代表性的信息产业上市公司作为实验样本,数据来源于证券之星网站。将上市公司因财务状况出现异常而被特别处理(ST)作为财务危机的标志。对于ST公司,采用被ST的前两年数据来进行预测分析,以判断其最终是否会陷入财务危机,样本区间设定为2004―2008年。对于非ST公司,则采用2008年的年报数据。在剔除异常数据样本,并对原始数据进行补缺后,最终获得88家样本公司,其中,定义0为财务危机公司,即ST公司,共28家;定义1为财务健康公司,即非ST公司,共60家。随机抽取19家ST公司和40家非ST公司作为训练样本,剩余的29家公司作为测试样本。

(二)R约简与规则生成

采用等频率划分方法对原始数据进行离散化处理。运用启发式算法对属性进行R约简,59个训练样本共产生了36条约简。在这些约简中,存在部分冗余无效的约简,为了提高约简的有效性,选取强度大于80的约简,共计12个。从属性约简结果可以看出:流动比率、速动比率、资产负债率、财务费用、已获利息倍数、存货周转率、应收账款周转率、净资产收益率、利润总额等9个指标对信息产业上市公司的财务预警具有重要影响。

在上述约简的基础上,利用Rosetta软件生成规则,设定限制条件为可信度>70%、覆盖率>5%,最终得到36条识别规则。限于篇幅,表1显示了其中可信度>80%的6条识别规则。表1中每一行表示一条识别规则。例如,第一行表示:当识别指标中资产负债率在0.6439以上,已获利息倍数在0.4291至1.5235之间,净资产收益率在7.8326以上时,样本公司的财务状况较好。该识别规则的支持数为10,可信度为0.961,覆盖率为0.31。

(三)财务危机识别方法的构建与检验

决策树又称判定树,是一种类似于二叉或多叉的树结构,与其它分类模型相比,决策树简洁易懂,容易转换成规则,且具有与其它分类模型相同的,甚至是更好的分类准确性。

VPRS在建立近似区间时,允许等价类以小于某个错误分配率(通常设β=0.2)的概率划入近似区间。由此,引入变精度明确区与非明确区的定义,将误差限内的实例划入VPRS的下近似中,成为能明确分类的实例,从而提高了分类的正确性和对未来数据的泛化能力。有鉴于此,本文运用基于VPRS的决策树生成方法,构建基于识别规则的决策树。决策树由根节点、分支和叶节点组成,这里的根节点是待识别样本,分支是待识别样本能否被识别规则正确识别,叶节点被分为正确识别样本和未能识别样本两类。为了在保证一定正确率的前提下得到尽可能简单的决策树,本文还运用基于RS的决策树剪枝算法对规则进行修剪。根据RS理论中近似空间的定义,首先给出明确度的概念来衡量数据被明确分类的程度,采用深度拟合率和错误率作为剪枝标准,同时考虑了树的复杂度和树的分类精度。剪枝过程自下而上持续进行,直至不能再剪枝为止。

利用29个测试样本对信息产业上市公司财务危机识别方法进行检验。每条规则可以将待识别样本分为正确识别和未能识别两类,设定误差参数β=0.2,对每个规则,计算其变精度明确区的大小,得出规则3的变精度明确区最大,说明规则3相对其它规则而言,能够提供更多的分类信息。选取规则3作为第1条规则,从根节点出发对29个测试样本进行判定,依次类推。运用基于RS的决策树剪枝算法,取阈值0.1及0.05,从决策树的最低层开始进行剪枝,得到剪枝决策树,如图1所示。图1括号中以*标识的数字X∶Y为到达此叶节点的多数例与反数例,X代表多数实例数,Y代表反例数,即有6个样本被正确识别,3个样本不能识别。图1显示:从29个测试样本中可以准确识别出26个样本的财务状况,只有3个样本不能识别,预测准确率达到89.7%。

四、结论

将VPRS引入到信息产业上市公司财务预警分析中,提出一种基于VPRS的信息产业上市公司财务预警方法。在对样本数据进行预处理后,首先,根据VPRS模型,对属性进行R约简并生成识别规则,形成识别规则库;然后,在识别规则库的基础上,集成剪枝决策树,构建信息产业上市公司财务危机识别方法;最后,利用测试样本对识别方法进行检验,获取识别精度。实证结果表明,本文提出的财务预警方法对信息产业上市公司财务危机的预测准确率达到89.7%,具有良好的应用前景。本文的研究为提高企业财务危机预测精度提供了新的方法和思路。但VPRS在引入误差参数的同时,也不排除向近似区间引入误差或噪声的可能性,如何合理选择误差参数β有待于进一步研究。

【参考文献】

[1] 李志强.上市公司财务预警研究述评[J].金融理论与实践,2009(3):86-90.

[2] Pawlak Z.Rough Sets[J].Int.J.Coumput.Inf.Sci,1982(11):341-356.

[3]王国胤.Rough集理论与知识获取[M].西安:西安交通大学出版社,2001:99-142.

[4] Ziarko W.Variable Precicsion Rough

Set Model[J].Journal of Computer and System Sciences,1993,46(1):39-59.

[5] An A,Shan N,Chan C,et al.Discovering rules for water damand prediction:An enhanced rough-set approach[J].Engineering Application and Artifical Intelligence,1996,9(6):645-653.

[6] 胡援成,程建伟.基于可变精度粗糙集模型的上市公司财务困境预测[J].当代财经,2007(5):32-36.

[7] 庾慧英,刘文奇. 变精度粗糙集模型中取值范围的确定[J].昆明理工大学学报,2005(12):109-111.

[8] 王加阳,陈松乔,等.可变精度粗糙集模型研究[J].计算机与数字工程,2005(8):53-54

[9] 顾靖,周宗放.基于可变精度粗糙集的新兴技术企业信用风险识别[J].管理工程学报,2010(1):70-76.

[10] Vapnik V. Statistical Learning Theory[M].New York:John Wiley,1998:1-173.

[11] 桑妍丽.变精度粗糙集下基于信息熵的属性约简算法[J].山西师范大学学报,2005(3):27-30.

[12] 王名扬.基于粗糙集理论的决策树生成与剪枝方法[D].东北师范大学硕士学位论文,2005:47-52.

上一篇:ST公司现金流量特征分析 下一篇:完善房产税征税范围关键点分析