spss教程:层次聚类之Q型聚类
聚类分析是一种建立分类的多元统计分析方法,它能够将以批样本(或变量)数根据其诸多特征,按照在性质上的亲疏程度关系在没有先验知识的情况下进行自动分类,产生多个分类结果。类内部个体特征具有相似性,不同类间个体特征的差异较大。
聚类分析中,个体间的“亲疏程度”极为重要,两个方法:个体间的相似程度(通过相关系数或等级相关系数)、个体间的差异程度(通过距离来测量)。
操作方法
- 01
层次聚类又陈系统聚类,Q型聚类是对样本(Cases)聚类,使相似特征的样本聚集在一起,差异大的分离开。
- 02
相关步骤见图片。因为是Q型聚类,所以选择“个案”,“合并进程表”可知每一次合并的具体情况,第一列:聚类分析的第几步;第二列、第三列为步骤中哪两个样本或小类聚成一类;第四列为个体或小类的距离;第五列、第六列表示本步聚类的是个体还是小类,0表示样本,非0表示第n步聚类生成的小类参与本步聚类,第七列表示本步结果将在以下第几步中用到。树状图是对聚类分析结果的显示。 分类数选择2或者3即可。 常用距离:个体距离采用平方欧式距离和;类间距离采用组间平均连锁距离。数据的数量级差别不大,不用进行标准化。 保存:是把聚类分析结果保存在原数据窗口中。
- 03
结果分析:聚类表就是第二步中的“合并进程表”,举例,分析的第1步,4与5聚成一类,欧氏距离是13,此小类的结果将在第3步中用到。树形图、冰挂图的结果都保存在原数据窗口中。
赞 (0)