聚类分析之分层聚类,k-mean均值聚类
1、层次聚类法(系统聚类)提供树状图(谱系图),树状图看法从右往左看,竖着切一刀,每一条线的左侧为一类,得到分类结果后,可以分析各类别中所属样本的变量特征(如均值,标准差,极大值,极小值)来判别所分的类别是否合理。除了描述统计外,可以使用方差分析来检验各不同类别的变量之间是否有显著差异软件操作时需要注意的事项:1、对样本进行聚类在分群下选入个案,若对变量进行聚类,在分群下选入变量2、聚类方法选入ward法,对原始数据标准化(数据差异大的话)处理,选择Z得分,3、点击保存时可以把不同的分类标签保存到原数据窗口总结,层次聚类事先不知道多少类需要一层一层进行,数据大的时候,聚类效率不高,一般都用k-mean聚类法,但是k-mean聚类法没有树状图,

3、数据差异大要标准化处理,用标准化的数据做k-mean聚类,标准化处理方法,执行命令:分析-描述统计-描述(D),进入描述列表之中,将需要标准化的变量选择过去。“将标准化得分另存为变量(Z)”之后点击打勾,.2、解读表意义,最终聚类中心表是指各个类别在各变量上的平均值,方差表是判断所分类别是否合理,分类后各变量在不同类别之间的差异是否显著