1、层次聚类法(系统聚类)提供树状图(谱系图),树状图看法从右往左看,竖着切一刀,每一条线的左侧为一类,得到分类结果后,可以分析各类别中所属样本的变量特征(如均值,标准差,极大值,极小值)来判别所分的类别是否合理。除了描述统计外,可以使用方差分析来检验各不同类别的变量之间是否有显著差异软件操作时需要注意的事项:1、对样本进行聚类在分群下选入个案,若对变量进行聚类,在分群下选入变量2、聚类方法选入ward法,对原始数据标准化(数据差异大的话)处理,选择Z得分,3、点击保存时可以把不同的分类标签保存到原数据窗口总结,层次聚类事先不知道多少类需要一层一层进行,数据大的时候,聚类效率不高,一般都用k-mean聚类法,但是k-mean聚类法没有树状图,
2、k-mean聚类法不能做出树状图,不能把所有可能的结果都列出来,需要研究者指定划分类别个数。然后确定各聚类中心。k是指事先要分的类别数,再计算出各样本到聚类中心的距离,按距离的远近进行分类,再以类别均值作为新的类别中心,根据新的中心位置,重新计算距离分类,终止聚类条件是迭代次数达到研究者事先指定的最大迭代次数,spss隐含的迭代次数是10,新确定的聚类中心点与上一次迭代形成的中心点的最大值偏移量小于指定的量。
3、数据差异大要标准化处理,用标准化的数据做k-mean聚类,标准化处理方法,执行命令:分析-描述统计-描述(D),进入描述列表之中,将需要标准化的变量选择过去。“将标准化得分另存为变量(Z)”之后点击打勾,.2、解读表意义,最终聚类中心表是指各个类别在各变量上的平均值,方差表是判断所分类别是否合理,分类后各变量在不同类别之间的差异是否显著