寿命数据的参数模型

时间:2022-10-25 09:21:37

寿命数据的参数模型

摘 要:寿命分布是统计学中一类重要分布。人的寿命或者电子产品或其它物种等的寿命,其统计规律是许多行业必须重视和分析处理的。寿命数据的统计分析在大学的数理统计教材中较少涉及,本文系统的介绍这类问题的几个概念和几个常用的寿命参数模型,供学习者参考。

关键词:寿命分布;生存函数;危险函数;指数分布;韦布尔分布;伽玛分布;对数正态分布

医学以及保险精算等的研究中,需要对人的寿命作统计分析。工业生产中的产品可靠性,需要用产品的寿命来衡量。对寿命数据的统计模型和分析方法在一般大学的数理统计教材中较少涉及,以下详细介绍寿命分布的几个数字特征,函数特征。介绍指数分布,韦布尔分布,伽玛分布,对数正态分布。

1 寿命分布的几个常用参数

设寿命T是一个非负连续型随机变量,T的分布函数F(t)=P(T≤t),T的密度函数为f(t)。

1.1 平均寿命与寿命的方差

用T的数学期望 来刻画总体T的“平均寿命”,用方差DT=E(T-ET)2来刻画总体寿命的波动程度。ET,DT是分布的重要数字特征。

1.2 生存函数(可靠度)

定义函数

在生存分析中,S(t)称为生存函数,在可靠性统计中,S(t)又被称为可靠度。它刻画了寿命超过一定年龄t 的概率,或者失效时间超过规定长度t的概率。

显然,对指定的t,S(t)越大越好。

若有两个总体:T1,T2,其生存函数分别为S1(t)和S2(t),满足S1(t)≥S2(t),0≤t,

则总体1的寿命分布一致优于总体2的分布。

S(t)具备下列性质:S(0)=1;S(t)为t的下降函数;limt∞S(t)=0;S'(t)=-f(t)。

1.3 危险函数(失效率)

考虑

P(tt)表示个体已经存活过(产品有效工作过)时间t,而在下一个时间间隔t内死亡(失效)的条件概率。当t很小时,则

这说明,当t很小时,P(t

这个比例系数h(t)称为危险函数或者失效率。

h(t)也可以作如下定义: 。

上述的两个定义的等价性是易知的。

以下说明:危险函数h(t),密度函数f(t),生存函数S(t)三者可以相互确定。

事实上,首先f(t)与F(t)是可以彼此相互确定的,进而f(t)与S(t)可以相互确定,h(t)可以由f(t)或S(t)确定。

另外,由于

再由S(0)=1有 ,此即可知h(t)可确定

S(t),再由f(t)=h(t)S(t)知,h(t)可确定f(t)。

危险函数(失效率)h(t)随时间t的流逝而变化。例如一台汽车在出厂后,需要一段磨合期,在磨合初期发生故障率较高(h(t)较大);而在磨合后期发生故障率较低(h(t)较小)。此后会逐渐趋于稳定,h(t)大致可看成是一个常数,相当长时间后,零部件老化,故障率会增高,h(t)变大。人的寿命分布也有类似这样一个“三部曲”。h(t)的这种特性无论对于医学研究还是对于产品的可靠性改善都有其重要的意义。

2 常用的寿命分布

我们仅用参数模型来刻画寿命分布。即认为寿命分布为某种已知类型的分布,其中有一些未知参数,当这些参数确定后,寿命分布就完全确定了。在寿命分布的参数模型中,下面几个是最常见的。

2.1 指数分布e(λ)

指数分布e(λ)的密度函数为f(t,λ)=λe-λt,0≤t,其中λ>0为参数,设随机变量T~e(λ),则

即指数分布的危险函数(失效率)为常数,而且它的条件寿命分布与无条件分布相同,这种性质叫无后效性。

可以证明:若失效时间分布的危险函数(失效率)为常数,则它一定是指数分布。

事实上 设h(t)=λ>0,则它的生存函数

,恰好为指数分布的生存函数。

2.2 韦布尔分布

韦布尔分布的密度函数为

,0≤t,其中β>0,α>0分别为形状参数和刻度参数。若T服从参数为α,β的韦布尔分布,则

当β=1时h(t)=1/α,即指数分布的危险函数,因此指数分布是韦布尔分布的一个特例。

当β1时,h(t)关于t单调上升。

2.3 伽玛分布G(k,λ)

伽玛分布G(k,λ)的密度函数为

其中k>0,λ>0 为参数。显然G(1,λ)=e(λ),即指数分布也是伽玛分布的一个特例。

伽玛分布的数学期望和方差分别为ET=k/λ,DT=k/λ2,

伽玛分布的生存函数S(t)和危险函数h(t)都没有简单的表达形式。

m为正整数时,G(m,λ)可看作m个独立同分布于ε(λ)的随机变量的和的分布;设T服从G(m,λ),则2λT服从x2(2m)分布。

2.4 对数正态分布LN(μ,σ2)

对数正态分布LN(μ,σ2)的密度函数为

事实上若lnT~N(μ,σ2),则T 服从对数正态分布LN(μ,σ2)。LN(μ,σ2)的期望和方差分别为

其生存函数与危险函数都没有简单的表达形式。对数正态分布作为寿命的模型有一个好处,就是将寿命或失效时间T 作对数变换后,就得到大家最熟悉和最易分析处理的正态分布。

参考文献:

[1] 陆璇.应用统计[M].北京:清华大学出版社,1999.

[2] 魏宗舒.概率论与数理统计教程[M].北京:高等教育出版社,1987.

[3] 茆诗松.可靠性统计[M].上海:华东师范大学出版社,1984.

[4] 张春华,陈循,杨拥民.常见寿命分布下环境因子的研究[J].强度与环境,2001(4):7-12.

[5] 高尚.剩余寿命分布研究[J].强度与环境,1995(3):61-64.

[6] Ross S.Stochastic Processes[M].何声武等译.中国统计出版社,1997.

上一篇:浅谈高速公路临时诱导设施的设置 下一篇:混搭设备环境下瘦AP部署wifi