基于极值理论的河南省火灾数据分析

时间:2022-08-10 10:44:20

基于极值理论的河南省火灾数据分析

摘要:进入21世纪以来,随着经济的飞速发展,造成火灾的各种因素越来越多,我国的火灾发生频率一直以来居高不下。本文基于河南省2007年至2012年的火灾数据,采用极值方法对河南省近6年的直接经济损失较大的极端火灾进行分析。得出河南省火灾直接经济损失重现水平,其中5年期重现水平为322.3万元,为下一步消防部门安排工作重心提供参考依据,为今后火灾数据的统计分析工作提供研究方向。

关键词:火灾形势;直接经济损失;极值理论

中图分类号: X928 文献标识码:A

近年来,随着经济社会的迅猛发展,致灾因素明显增多,火灾发生几率和控制难度相应增大,河南省每年发生火灾五千多起,伤亡百余人,造成的直接财产损失超过1亿元,给人们的生命财产造成巨大损失,因此,人们希望能过预知灾害的发生,以便采取针对性的措施减少火灾损失。

火灾的发生具有很大意义上的随机性,并且造成火灾的原因多种多样,火灾过程复杂多变,对于火灾现象的研究现在仍在继续,通常采用统计的方法来对火灾原始数据进行分析。有些人认为采用统计的方法对火灾数据进行分析并不能帮助我们更好的理解火灾发生发展的整个屋里过程,然而极值分析可以通过火灾原始数据得到很多有用的信息。本文主要研究通过一元极值理论对2007-2012年河南省火灾原始数据进行分析。

一、利用极值理论进行火灾数据分析

(一)基础极值理论

从概率的角度来看,随机变量中极端变异的数据称为极值;从统计学的角度来看,极值是随机变量中极大值和极小值的统称。极值统计理论对数据进行分析的主要任务就是根据基于某样本的观测数据的极值建立一个概率模型,但是这需要观测数据具有一定的特征,主要有以下三个要求:(1)观测数据是随机变量;(2)该随机变量的底分布保持不变,若有变化,也应该可以通过数据处理来降低这些变化带来的影响;(3)观测数据中的极值之间是相互独立的,不能有潜在的联系,若有联系,可以采用一些合理方法对其进行处理。极值类型定理又称最大值极限分布定理,它表明在经过线性变换后,独立同分布的极大值序列依分布收敛于一个非退化分布。也就是说,在经过标准化以后,极值的渐进分布必为Gumbel、Frechet、Weibull三种类型之一。这一定理是极值理论的核心内容,它提供了类似于中心极限定理的极值收敛定理。

(二)阈值模型和选取

区组最大模型会造成数据的极大浪费,而我们关心的是分位数的估计,因此利用超过某一阈值的极值数据建模,这种抽取极值的方法就称为POT方法(Peak over threshold),即阈值法。考虑超过阈值u的那些观测值X,可以利用超阈值分布或超出量分布函数来描述。广义Pareto分布(generalized Pareto distribution),简记为GPD分布。GPD分布专门用于描述超过特定阈值的观测数据集的概率分布特征。

阈值越高,超过阈值的样本数就越少,则参数估计的方差增大。反之,虽然增加了估计精度,但又不符合超出量服从GPD分布的要求条件。然而,阈值的选取至今没有一个统一方法。如何合理的确定阈值仍是现阶段极值理论研究中亟待解决的问题。目前选取阈值的方法主要有图解法与计算法两大类。

(三)河南省火灾直接财产损失分析

以河南省2007-2012年6年间的火灾数据为基础进行分析,以图1.1为例,为河南省火灾损失值数据的平均剩余寿命图及相应的95%置信区间,阈值单位为“千元”。由图可见,从u=0到u=500图形为曲线,从直到u=500到u=4000图形近似为直线,超过u=1000,图形急剧下降。这表明应该取u=1000,然而实际情况中在两万多个多个数据中超过1000的数据较少,造成数据的浪费。因此我们取阈值为0到500之间。进而,我们采用判断u值改变引起估计量的变化来确定u值。

在一个阈值取值范围内,利用超出量估计广义Pareto分布的参数,若初始阈值对应的超出量近似为广义Pareto分布,则对大于的值,形状参数的估计值应该保持不变。而却是u的函数,这里是区组最大值的极限分布,即广义极值分布中的尺度参数。

图1. 1河南省2007-2012年全省火灾直接经济损失平均剩余寿命图

由上述情况可知,若选择作为阈值是合适的,那么相应的超出量服从广义Pareto分布,则考虑大于的u,其相应的估计量与保持不变。考虑到抽取样本是随机进行的,这些估计量不可能都为常数,但是它们应该在一个能够接受的抽样误差范围内波动。根据平均剩余寿命图的作法,作以及关于u的曲线并计算相应的95%置信区间,在曲线中能够使两个估计量保持为常数或在小范围内波动的最小u值即可以被选作阈值。通过对0到500之间平均选取的100个值进行GPD模型估计得出大致的阈值范围为(400,500)。

从概率图来看,模型的拟合效果很好,绝大部分点都在直线上,从分位点来看,在经济损失低于3000(千元)时,所有点都在直线上,在高于3000(千元)时仅有1个点偏离较大,可以作奇异点处理,因此通过阈值模型诊断图不能否定模型。从重现水平图上看以看出随着重现期的增加,重现水平上升趋势越来越快。

在采用阈值模型计算出估计量以后,可以与轮廓似然函数的结果进行对比,有可能能够得到更加精确的置信区间。图1.5为河南省火灾直接经济损失阈值模型中的轮廓似然函数。通过河南省全省火灾直接经济损失阈值模型中的轮廓似然函数得到形状参数的估计值为0.106,95%置信区间为[-0.535,0.748],根据似然函数微调后的95%置信区间为[-0.367,1.036],差别不大。其不同重现期重现水平如表1.1及图1.5所示。表1.1中40年、50年和100年重现水平的置信区间下限已经小于0了,因此不考虑它们。

表1. 1 2007-2012年河南省火灾直接经济损失重现水平

重现期(年) 95%置信区间下限(千元) 重现水平(千元) 95%置信区间上限(千元)

1 919.12 1540.71 2162.30

2 1330.33 2230.48 3130.62

3 1507.12 2658.06 3809.00

4 1573.16 2972.76 4372.36

5 1582.40 3223.55 4864.70

6 1560.12 3432.90 5305.67

7 1519.30 3613.08 5706.86

8 1467.12 3771.56 6075.99

9 1407.82 3913.22 6418.61

10 1344.03 4041.44 6738.85

20 658.99 4921.60 9184.21

30 30.93 5467.21 10903.48

40 -- 5868.77 12261.84

50 -- 6188.78 13398.50

100 -- 7232.43 17422.65

图1.3 河南省电气火灾直接经济损失重现水平

图1.6为基于阈值模型的河南省全省火灾直接经济损失5年期重现水平轮廓似然图。从图中可以看出,重现水平的置信区间并不对称,并且随着重现期的增大,这种不对称性越来越明显。因此我们需要根据轮廓似然图对重现水平估计值的置信区间进行调整。最后得到5年期重现水平估计值为3223.55千元,95%置信区间为[2190.04,9786.90],而根据统计数据在近5年内发生的直接经济损失最高的火灾为4498.49千元,调整后的置信区间也能够包括这场火灾,但比估计值更加保守。

图1. 6 2007-2012年河南省火灾直接经济损失5年期重现水平轮廓似然图

二、郑州市火灾数据极值分析

郑州市作为河南省的省会,经济发达程度较高,同时火灾发生频率也远远超过其他地市,郑州市2007-2012年六年间共发生火灾8197起,占到了全省火灾总数的37.8%,火灾形势比较严峻。郑州市火灾直接经济损失平均剩余寿命图及不同阈值的参数估计图见图1.12和1.13。根据图1.12可以看出从一开始即u=0时图形就已经为直线,因此根据平均剩余寿命图并不好判断u的具体值,只能根据不同阈值的参数估计来确定阈值。最终选择u=50,整个数据集中超过阈值的有186个数据,占到总体的2.27%。

图1. 12郑州市2007-2012年火灾直接经济损失平均剩余寿命图

图1. 13郑州市2007-2012年火灾直接经济损失阈值参数估计

图1. 9 河南省2007-2012年全省电气火灾直接经济损失阈值模型诊断图

从概率图来看,模型的拟合效果很好,绝大部分点都在直线上,从分位点来看,在经济损失低于300(千元)时,所有点都在直线上,在高于300(千元)时仅有3个点偏离较大,可以作奇异点处理,因此通过阈值模型诊断图不能否定模型。从重现水平图上看以看出随着重现期的增加,重现水平上升趋势越来越快。

在采用阈值模型计算出估计量以后,可以与轮廓似然函数的结果进行对比,有可能能够得到更加精确的置信区间。通过河南省郑州市火灾直接经济损失阈值模型中ξ的轮廓似然函数得到形状参数ξ的估计值为0.106,95%置信区间为[-0.041,0.396],根据似然函数微调后的95%置信区间为[-0.015,0.432],差别不大。仅有一场损失为50万的火灾没有落在置信区间里面,说明阈值模型较为准确。

图1.15为基于阈值模型的郑州市火灾直接经济损失5年期重现水平轮廓似然图。从图中可以看出,重现水平的置信区间并不对称,并且随着重现期的增大,这种不对称性越来越明显。因此我们需要根据轮廓似然图对重现水平估计值的置信区间进行调整。最后得到5年期重现水平估计值为560.78千元,95%置信区间为[416.48, 970.73],而根据统计数据在近5年内发生的直接经济损失最高的火灾为500千元,调整后的置信区间能够包括这场火灾,而且比估计值更加保守。

图1. 15基于阈值模型的郑州市火灾直接经济损失5年期重现水平轮廓似然图

三、结论与展望

(一)结论

采用极值理论对河南省全省、河南省电气火灾、郑州市及洛阳市火灾数据进行分析,研究极端损失火灾事件的规律。在利用极值理论对极端损失火灾事故进行研究时,根据不同的数据集科学的选取不同的阈值,根据阈值模型计算火灾直接经济损失的重现水平,并通过重现水平的轮廓似然估计对置信区间进行调整,得到了重现期与重现水平表,其中河南省火灾直接经济损失5年期重现水平为322.3万元,郑州市为56.1万元,结果较为准确,为今后的消防工作提供了一定参考。

(二)展望

基于本文的研究情况,后续的研究工作应该集中在以下几个方面:

(1)在采用极值理论对火灾数据进行分析时,阈值的选取方法依然需要改进,因为本文中结果有少量点没有落在置信区间内。

(2)从分析结果来看,极端火灾损失事故的极端性越来越大,如何准确的对其进行预测需要更加深入的研究。

参考文献

[1]景国勋,王卫敏,温宏民.基于BP神经网络的河南省火灾风险评价[J].中国安全科学学报,2007,(8).

[2]郭铁男.我国火灾形势与消防科学技术的发展[J]. 消防科学与技术,2005,(6).

[3]刘海生等.基于统计数据的全国火灾形势综合评价与预测[J]. 中国安全科学学报2011年第6期

[4]郑双忠等.基于火灾统计灾情数据的城市火灾风险分析[J].中国安全生产科学技术2005年第1卷第3期

[5]王静虹等.城市火灾自组织临界性判断及大火灾损失极值分析[J].科学通报2010年第55卷第22期

[6]Ramachandran G.Properties of extreme order statistics and their application to fire protection and insurance problems[J].Fire Safety Journal,1982 5(1):59-76.

上一篇:混凝土加气块墙体裂缝的成因分析及防治 下一篇:基于静态游人行为的城市开放空间研究