稳健统计理论及其应用思路构建

时间:2022-09-19 09:12:12

稳健统计理论及其应用思路构建

摘要: 统计学是一门具有很强应用性的工具性学科,它主要的作用就是在各种数据当中找出有用信息,然后在此基础上对该领域进行归纳总结,再将这些归纳总结的结论或者特征用于实践指导。但在利用统计学进行分析时,不可避免的会出现一些偏离状况,而稳健统计学的使用可以尽可能的避免偏离状况的出现。本文主要针对其理论和应用之上进行了分析。

Abstract: Statistics is a tool discipline with high application. Its main role is to find useful information among the various data, and summarizes this area on this basis, then applies these conclusions or characteristics in practical guidance. However, when using the statistics for analysis, some deviation position will inevitably appeared. The use of robust statistics can as much as possible to avoid the deviation situation. This article focused on the theory and application to analyze.

关键词: 稳健统计;理论分析;应用思路

Key words: robust statistics;theoretical analysis;application ideas

中图分类号:C8 文献标识码:A 文章编号:1006-4311(2014)16-0324-02

0 引言

进行稳健统计其实质就是针对传统统计的不足之处,进而使得统计逐步稳健化。在进行传统统计之时可能会出现假定和实际相互偏离的现象,或者由于实际问题的复杂性因素,在统计的时候就容易出现偏差,有时候偏差较大,甚至结论完全错误。通过稳健统计理论的使用,将能够有效的克服,或者进一步控制以上问题。

1 稳健统计理论分析

我国稳健统计的研究发展开始于六十年代,经过将近二十年的发展和探究,初定型于八十年代。随着如今科技的飞速发展,稳健统计也随之不断进步,加之计算机技术的广泛应用,进一步的推动了其发展。稳健统计是统计过程当中稳定性的理论部分。在假设已知的前提之下,该理论较为系统分析了离群值的影响。在经典假设满足的情况之下,通过以往的经典统计方式将能够确保结果优良,比如小样本下的t估计。最小二乘回归估计等。反之,如果无法全面满足所需要的假定条件,则无法得到理想结果。通过稳健统计的使用,将能够将离群值的影响控制在一定的度,确保最终的结果不会有太大偏差。

比如在一个多变量线性回归当中存在离群值,在寻找离群值之时可以通过稳健方式,以及回归诊断方式进行。通过稳健方式确认的模型,将能够较为符合大部分的数据特征,然后在此基础之上找到离群值。但通过一般的回归诊断则会相对麻烦,需要将有关的数据全部进行计算,然后利用结果进行寻找。这样做不仅费时费力,而且在其计算的过程当中,离群值已经对数据造成了影响,用存在偏差的结果确定离群值,最终结果必将存在一定的不合理性。由此可见,稳健统计比之一般的回归诊断更加具有稳定性和有效性。其在计算估计量之时,首要工作就是识别离群值,最大限度的保障结果的合理性。综上所述,通过稳健统计理论的运用,将有效的控制离群值对结果的影响,控制偏差,提高其科学性和合理性。

对此,Huber针对稳健统计,提出了三大主要目标:第一,在满足经典假设的模型之下,确保估计值满足合理需求,同时具备有效性。第二,如果所建造的假设模型,以及实际的模型之间存在一定的差异,且差异较为微小之时,在此时无论是统计方法之上,还是对于估计值,相应的受到的影响也会较小。第三,如果假设和实际模型之间偏离严重,由于几乎不会遭受破坏性的影响,因此仍然可以接受估计值性能。

2 稳健统计理论的应用和思考

2.1 稳健统计在发达国家的有效应用

稳健统计在经过了几十年的发展和完善,已经拥有了较为成熟的理论,并且应用范围十分广泛,优势显著。尤其是发达国家,对于稳健统计理论的应用和研究较为深刻和完善。加拿大政府广泛的应用了稳健统计理论,利用该理论和有关方法,将相关的经济指标的多元数据进行了整理,以便针对理论值进行及时的发现和有效的处理。通过将稳健统计方法用于多元统计,主要包括了位置向量,以及协方差阵。对于数据当中存在离群值的情况,通过该方法的使用将能够有效的控制其不利影响,进而提高结果的合理性。

对于官方统计公布的收入、城市人口模型等经济指标数据,充分利用了稳健估计方法进行分析。比如在改进一般统计量之时,在充分利用原始数据的基础之上,通过数变换方式,或者平方根的变换,最终得出的稳健统计量结果良好。新西兰从一九九二年开始,对于全国健康情况都会每四年调查一次。在进行调查分析之时就充分利用了稳健统计理论,利用稳健统计量和方法,针对各项健康指标进行分析、处理。新西兰对于稳健统计理论的成功应用,不仅为本国的工作开展提供了有效方式,同时为世界各国做了一个好榜样。

由此可见,由于稳健统计的诸多优势,使得世界各国无论是官方机构,还是研究结构、民间机构,都对其有着高度的重视。通过稳健统计的使用,进一步完善了其各种统计工作,也从侧面体现出各发达国家统计学的高度发达程度,同时反应出其市场化高度发展。我国在这方面的研究应用相对较晚,但也得到了不小的进步和发展,应用也较为广泛。稳健统计被广泛应用在各领域当中,比如环境学、地质学等。然而官方统计方面的应用还较少,因此还需要进一步扩大其使用,充分实现其优越性。

2.2 在应用之上的思考

第一,官方统计应该更加重视统计量的系统化公布,并且对于当中所反映出的信息进行有效的解释。比如针对收入分布情况,对其位置特征之上的描述,可以通过中位收入、平均收入等,同时结合基尼系数、劳伦茨曲线等进行有效的描述。同时要注意离群值的影响,优化统计结果。

第二,开发和应用离群值处理方式。稳健统计和传统的统计之所以存在差异,主要还是在稳健性之上。由于受到离群值的不利影响,进而使得使用传统的统计方式结果将会出现不同程度的偏差,而稳健统计有效的提高了结果的合理性。因此这就要求要不断提高针对离群值的处理技术。离群值主要指的是那些偏离大部分数据的极端数据,它的值可能极大,也可能极小。也有可能是在进行测量之时,由于测量人员的失误、测量条件欠缺等方面,进而出现偏离主体的数据。

第三,加强统计量的对比研究。比较统计学概念,不仅需要从思想、流派等之上进行比较,还需要在统计量、统计分布等之上进行比较。而将传统统计量,以及稳健性统计量之间的对比研究,无疑就是此研究当中最为突出的部分。

第四,对于统计量的稳健性要求,其实质就是最大限度的控制离群值的影响作用。然而在利用稳健统计之时不可避免的存在一些不足之处,将会损失一定的观察值信息。这就要求在稳定性和有效性之间取得一个平衡,不至于偏废一方,尽量提高最终结果的合理性,同时也是稳健统计的发展需求。比如在数据当中,如果出现了离群值,则在一定程度反应出一些还处于隐性状态的优势和亮点,潜藏着发展的新方向。

第五,充分利用计算机技术。稳健统计理论的应用,要求充分利用计算机技术,进一步的提高其计算和分析能力,扩展其优势。有时候可能需要涉及的数据较少,只是利用手工便能完成。但针对那些涉及数据较多,计算复杂,必须经过多次迭代才能够完成的统计,在此时对计算机技术的使用就变得十分必要和重要了。目前应用十分广泛的主要有sas、spss等软件。其都十分适合和稳健统计结合使用,可以有效的辅助统计工作。

3 结束语

对于传统的经典统计常常由于各种因素的影响,导致最终的结果与实际偏差较大,甚至出现错误情况。而稳健统计的使用将能够有效的转变这种情况,将离群值的影响降低到最小。这就要求在之后的发展当中还应该进一步扩大应用,同时不断的进行完善和改进。

参考文献:

[1]郭亚帆.稳健统计基本理论及其在居民收入与支出指标中的应用研究[D].天津财经学院,2005.

[2]杨善林.农户收入与支出指标的稳健统计方法[J].商业经济,2009,03:24-25,47.

[3]丁硕.稳健统计方法在股票投资组合中的应用研究[D].北京工业大学,2009.

[4]邢小茹,马小爽,田文,吴忠祥.实验室间比对能力验证中的两种稳健统计技术探讨[J].中国环境监测,2011,04:4-8.

[5]李春倩.稳健统计在经济指标中的应用研究[J].商场现代化,2012,10:108.

上一篇:试论高职院校图书馆举办会展的必要性 下一篇:“中国梦”视阈下高职院校思想政治教育模式探...