Matlab统计工具箱的若干优化补充

时间:2022-06-07 07:51:54

Matlab统计工具箱的若干优化补充

摘 要:针对Matlab 6.5统计工具箱没有优化正态总体方差的区间估计,且没有给出正态总体方差检验的问题,通过编写Matlab程序,优化统计工具箱对正态总体方差的区间估计,开发正态总体方差的假设检验算法. 实例表明该方法在推断统计方面实用性较强.

关键词:Matlab; 统计工具箱; 区间估计; 假设检验

中图分类号:O212.1;TP311.52

文献标志码:A

Optimization and supplement on Matlab statistics toolbox

YOU Wenjie1, 2a, DENG Liangzhang2b, 3

(1.Fuqing Branch, Fujian Normal Univ., Fuqing Fujian 350300, China; 2.a.College of Computer & Info. Eng.;

b. College of Mathematics Sci., Xiamen Univ., Xiamen Fujian 361005, China;

3.Fujian Polytechnic of Info. Tech., Fuzhou 350003, China)

Abstract: The interval estimation on variance of normal distribution isn’t optimized in Matlab 6.5 statistics toolbox, and it doesn’t provide hypothesis testing on variance of normal distribution. So a Matlab program is developed to optimize interval estimation on variance of normal distribution, and provide arithmetic of hypothesis testing on variance of normal distribution. The examples show that the method has better practicability on deducing statistics.

Key words: Matlab; statistics toolbox; interval estimation; hypothesis testing

0 引 言

Matlab应用于统计分析上所具有的操作简单、接口方便、扩充能力强等优势是其他软件(SAS,SPSS等)不可比拟的,再加上其应用范围广泛,因此在统计应用上占据极其重要的地位.Matlab 6.5统计工具箱(Statistics Toolbox)[1]加强Matlab在统计分析方面的功能,并提供250种以上的运算功能以及易于使用的接口,让使用者能够轻松分析历史资料、构建数据模型、仿真系统并发展统计算法.

参数估计和假设检验是数理统计最基本的方法.Matlab统计工具箱在正态总体方差的区间估计并非最优,并且没有给出正态总体方差的检验.本文针对该缺陷进行优化,并发展统计工具箱在正态总体方差的假设检验算法.

1 基于Matlab的正态总体方差区间估计算法的改进与优化

利用样本对总体进行统计推断的一类问题是参数估计,参数估计分为点估计和区间估计两种.Matlab统计工具箱在参数估计方面提供多种分布类型的分布函数及其置信区间的估计方法.

1.1 单正态总体方差的区间估计[2,3]

设总体X服从正态分布N(μ,σ2),X1,X2,…,Xn为总体X的随机抽样,样本均值为X,样本方差为S2,对总体参数σ2的区间估计有结论:σ的置信度为1-α的置信区间为Иn-1S[KF(]χ2│2(n-1)[KF)],n-1S[KF(]χ21-α2(n-1)[KF)]И

在给定置信度情况下,置信区间是不唯一的.区间越长说明估计值分散的可能性越大,所以区间长度是估计优良的反映.为此,在置信水平一定的前提下,应该选取区间长度最短的一个.但在实际应用中,仍取对称的分位点χ21-α2(n-1)与χ2│2(n-1)来确定置信区间,这种方法得到的不是最优区间估计,并且在小样本时会产生不小的误差.以下利用Matlab强大的数值计算能力实现非对称χ2分布区间估计的优化.输入置信度及样本值,就可得更优(短)区间,简单直观.

1.2 置信区间算法优化改进[1,4]

在Matlab中编制函数文件minsigmaci.m,存入统计工具箱中以备调用.

function [sigmaci,len] = minsigmaci(x,alpha)

len=100;

m=size(x,2);%样本容量

sigmahat = std(x);%样本标准差

for i=101:200

k=i/100;

chi2crit1 = chi2inv(alpha/k,m-1);%调用chi-square分位点函数

chi2crit2 = chi2inv(1-alpha*(k-1)/k,m-1);

sigmacileft=sigmahat*sqrt((m-1)/chi2crit2);

sigmaciright=sigmahat*sqrt((m-1)/chi2crit1);

length=sigmaciright-sigmacileft;%置信区间长度

if length < len

mink=k;%用来计算两侧尾部概率

minsigmacileft=sigmacileft;

minsigmaciright=sigmaciright;

len=length;

end

end

sigmaci = [minsigmacileft;minsigmaciright];%优化后的置信区间

len;%优化后置信区间长度

2 基于Matlab的正态总体方差的偕瑾检验

利用样本对总体进行统计推断的另一类问题是假设检验,Matlab统计工具箱在假设检验方面提供包括单样本t检验、双样本t检验、z检验和χ2拟合检验等方法,但没给出对单正态总体方差的χ2检验.

2.1 单正态总体方差的假设检验

上述检验法称为χ2检验法(注:不同于Matlab统计工具箱提供的χ2拟合检验法).以下利用Matlab实现正态总体方差的χ2检验,补充统计工具箱在正态总体方差的假设检验算法.

2.2 单正态总体χ2检验算法实现

在Matlab中编制函数文件chi2test.m,存入统计工具箱中以备调用.

function [h,sig] = chi2test(x,sigma,alpha,tail)

samplesize = length(x);%样本容量

s2 = var(x);%样本方差

chi2 = (samplesize-1)*s2/(sigma^2);%chi2-square抽样分布

if (tail =

3 实例应用

例1 试验室有一批贵重元器件,设元器件的使用寿命近似地服从正态分布,试求该元器件总体标准差σ的置信度为0.95的置信区间.随机抽样检测4个元件,测得数据如下:506,508,499,503,504.

(1) 传统区间估计方法 计算样本标准差S=3.391 2.由置信度1-α=0.95,α=0.05,自由度n-1=5-1=4;查表得:

(2) 调用统计工具箱函数 调用优化前normfit函数[1],运行如下代码

x=[506 508 499 503 504];

alpha=0.05;

[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha);

sigmaci

运行结果:sigmaci =2.031 8 9.744 7

调用优化后minsigmaci函数,运行如下代码

x=[506 508 499 503 504];

alpha=0.05;

minsigmaci(x,alpha)

运行结果:ans =1.668 0 8.156 5

评注 按传统方法计算出的置信区间不是最优的.利用优化后统计工具箱minsigmaci函数,求得置信区间(1.668

例2 某试验室用一台精密仪器加工某元件.该元件的使用寿命是随机变量,并服从正态分布.仪器正常时,其均值为 0.5 kh,标准差不超过0.015 kh.某日开机后为检验该仪器是否正常,随机抽取它所加工的元件9个,测得数据(kh)为

问仪器是否正常?(显著性水平α=0.05)

(1) 调用统计工具箱函数ztest 检验

调用ztest函数,运行如下代码

所以拒绝原假设 ,接受备择假设 ,即发现仪器存在显著偏差,该仪器均值不为0.5 kh.

(2) 调用统计工具箱(编制)函数chi2test 检验 调用chi2test函数,运行如下代码

所以接受原假设 ,拒绝备择假设 ,即没有发现仪器存在显著不稳定,可以认为该仪器标准差不超过0.015 kh.因此说明该仪器虽然工作稳定,但是仪器存在显著偏差(偏大),故仪器工作不正常.

评注 该问题隐含两个问题:(1)检验 ;(2)检验σ≤σ0.对于问题(1)直接调用Matlab统计工具箱ztest函数,h=1说明拒绝原假设 说明样本观测值的概率非常小(

4 结束语

Matlab统计工具箱应用非常广泛,除了其本身提供的工具箱以外,还可以根据实际问题的需要,建立起相应的m-文件(命令式文件或函数式文件)解决更加复杂的问题,并且程序通用性强.本文在推断统计方面对统计工具箱进行一些优化与补充.

参考文献:

[1]The Math Works, Inc. Statistics toolbox user’s guide [EB/OL

].[200508]./access/helpdesk/help/toolbox/stats/

[2]盛骤, 谢式千, 潘承毅. 概率论与数理统计[M]. 2版. 北京: 高等教育出版社,

1989: 173,202.

[3]陈希孺. 数理统计引论[M]. 北京: 科学出版社, 1999.

[4]郭永宁, 黄丽华. 提高Matlab程序运行效率的若干手段[J]. 福建电脑, 2005 (11

): 147.

[5]魏宗舒. 概率论与数理统计教程[M]. 北京: 高等教育出版社, 1983.

“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”。

上一篇:预应力渡槽有限元分析 下一篇:他们不是全能王