时间:2022-08-27 12:36:21
【摘 要】本文首先通过调和曲线图和脸谱图对2010年各地区城镇居民家庭平均每人全年消费性支出做了大致分析(数据来源于《中国统计年鉴2011》),得出根据不同城市消费情况可将这31个地区分为3个不同类别的结论。经过因子分析,降低指标的相关性和维数,最后聚类分析。聚类分析的结果也是将以上31个省市划分为3个不同的类别。
【关键词】调和曲线图;脸谱图;因子分析;聚类分析
0 导言
不同城市地区的消费水平是不同,一个城市的消费水平严重影响着人们对于这个城市的经济判断、高考生对于大学地点的选择等等,所以选取2010年各地区城镇居民家庭平均每人全年消费性支出数据做相关分析是有着比较强的实际意义的。
本文首先用调和曲线图和脸谱图判断出其类别,然后经过因子分析降维,再用k-均值聚类分析得出所分出的类别。由因子得分的排名可知不同类别所代表的消费水平是较高的一类还是较低的一类。
1 数据及其初步分析
本文数据取自《中国统计年鉴2011》将所有数据进行标准化,然后根据标准化后的数据,可以得出如图1的调和曲线图。
图1 调和曲线图
以北京市的数据(标准化后的数据,以下分析的所有数据如不做特殊说明则均为标准化后的数据)为例调和曲线的计算如公式(1):
f北京(t)=■+0.13sint+1.86const+2.71sin2t+1.26cos2t+0.17sin3t
-0.35cos3t+1.31sin4t(1)
从调和曲线可以看出各地区城镇居民家庭平均每人全年消费大概分为3个类别,一个是以北京、上海等为一类别,一个是以江苏、天津为一类别,另一个是以、广西等为一类别。
2 因子分析
因子分析的前提条件是通过了数据的相关性检验,我们用spss17.0对表转化的数据进行了检验,检验结果如表1:
表1 KMO检验和Bartlett球度检验
从表中可以看出Bartlett球度检验统计量为104..984。检验的P值接近0,表明上述8个变量之间有较强的相关关系。而KMO统计量为0.674,说明适合作因子分析。
从以上分析可以看出,因子1的服装、鞋类、室内装饰瓶和住房对应的载荷系数比较大,同时住房影响着室内装饰,服装也影响着鞋类,因此因子1可以命名为“衣、住相关”因子;因子2只有肉禽及制品对应的载荷系数较大,因此因子2可以命名为“食品相关”因子。
图2 旋转后的因子载荷图
从旋转后的因子载荷图可以看出旋转后的因子载荷系数大部分都接近1。根据spss输出的按回归法(Regression)估计的因子得分系数矩阵有:
f1=0.213x1+0.039x2+0.268x3+0.224x4+0.26x5+0.115x6+0.008x7
+0.266x8(2)
f2=0.187x1+0.441x2-0.209x3-0.302x4+0.263x5-0.057x6-0.326x7
+0.075x8(3)
式中f1表示因子1,f2表示因子2,x1至x8分别表示粮食、肉禽及制品、服装、鞋类、住房、水电燃料、家具材料、室内装饰品这8个指标。
同时由表3可以计算出因子的总得分表达式:
F=0.63f1+0.27f2(4)
式中F表示总得分f1表示因子1,f2表示因子2。将标准化后的数据代入(2)、(3)式中得到f1与f2的值,可以得出各地区两因子得分的散点图,然后将f1与f2的值代入(4)式中变可以得到各省市的因子总得分,进而可以得出因子总得分排名表。可看出上海、北京、广东、天津的得分最高,也就是说这几个地区的居民家庭平均全年消费支出比较高,尤其上海市,得分远远超过其他省市。
3 聚类分析
在二中通过调和曲线图和脸谱图我们可以得出要分为3类的结论,所以运用spss的K-均值聚类法,得出如下分类结果:
表2 分类结果图
从表2中可以看到上海市被单独聚为1类,从三的分析也可以佐证这一点,因为上海市的总得分远远高于其他省市的总得分;同时有22个省市被聚为一类,这一类可以认为是代表了全国的平均家庭年人均消费水平,因为塔它出处在中间位置同时占据的数量最多;最后9个省市包括、广西等比较偏远的省区,它们被分为一类。
4 总结
本文通过《中国统计年鉴2011》中的各地区城镇居民家庭平均每人全年消费性支出数据做了因子分析和聚类分析,最终看到上海市的消费支出最高,并且远远高出其他省市,在聚类分析中被单独分为一类;而大部分省市(31个省市中有22个)是属于同一类的,我们可以理解为这类省市代表了全国的平均人均消费支出,也就是全国人均的年消费水平;还有一部分省市(31个省市中有9个)是低于全国人均消费水平的。
通过统计知识的分析可以得出一个与生活体会比较接近的结论,这又再次证明理论与实际的一致性。
【参考文献】
[1]中国国家统计局.中国统计年鉴[Z],2011.
[2]于秀林,任雪松,编.多元统计分析[M].中国统计出版社.
[3]约翰逊,威克恩.实用多元统计分析[M].清华大学出版社,2008:11-22.
[4]曾五一,肖红叶,编.统计学导论[M].科学出版社.