时间:2022-07-12 03:57:28
【摘要】本文运用R软件以人造黄油生产商以特定的属性为基础,对11种乳制品的消费评价感兴趣,结果分为了三类。
【关键词】聚类分析 儿童 营养状态
一、引言
某人造黄油生产商以特定的属性为基础,对11种乳制品的消费评价感兴趣。
乳制品(黄油和人造黄油)Mk(k=1,2...,11) 特征变量:xj (j=1,2...,10)(主观的评价)
Sanella 可涂抹性
Homa 价格
SB 适合烤和煎
Delicado 口味
Hollandische Markenbutter 卡路里含量
Weihnachtsbutter 动物脂肪含量
Du darfst 维生素含量
表1.1案例中研究的品牌和变量属性评价通过32个受访者得到。他们根据这些属性,按一个七级评价等级对每一个品牌进行打分,因此可以得到一个三维矩阵(32*11*7)。因为聚类分析的算法只能分析二维数据,因此考虑后面一个11*7的矩阵,这个矩阵以11种乳制品作为样本,7种属性评价作为变量。
二、数据处理与分析
本次聚类分析采用的是层次聚类的方法。
层次聚类产生的最重要的结果就是谱系图,通过谱系图可以非常直观地看出整个聚类过程和结果。在谱系图中,聚类的全过程以直观的方式表现出来,它把类间的最大距离算做相对距离为25,其余的距离均换算成与之相比的相对距离大小。图形的左边代表进行聚类的对象或是事物,而对象或者类别的合并则通过线条连接的方式来表示,在这个例子中,对应的是这些黄油品牌编号列在结果的最左边,而在结果的上部列出的是类别见的相对距离,通过观察这个结果,可以将这些黄油品牌分为若干个类别。
图1谱系图
方案一:分为6类
第一类:case3,case9,case11,case10;第二类:case2;第三类:case1,case7;第四类:case8;第五类:case4,case5;第六类:case6
方案二:分为3类
第一类:case3,case9,case11,case10,case2;第二类:case1,case7,case8;第三类:case4,case5,case6
参考文献:
[1](美)约翰逊(Johnson,R.A.).实用多元统计分析[M].清华大学出版社,2008.
[2]薛毅.统计建模与R软件[M].清华大学出版社.
作者简介:王军良(1963-)、男、汉族、陕西西安人,副教授、1986年毕业于东北电力学院,本科学历,陕西国防工业职业技术学院在职教师,现从事暖通空调教学研究工作。