SAS中文论坛

标题: SAS多元分析之聚类(1)–proc cluster [打印本页]

作者: shiyiming    时间: 2012-1-8 13:14
标题: SAS多元分析之聚类(1)–proc cluster
From hssnow's blog on hssnow.name

本文主要对SAS做聚类分析的proc cluster步的应用做一个简单的摘录,相关的理论知识细节,请参见SAS help文档及其他统计学相关文献等。 1.简介 proc cluster一般适用于规模较小的样本观测聚类(即Q型聚类)。proc cluster为系统聚类,包括11种方法,根据“距离”作为分类标准。 2.proc cluster 常用语法格式: PROC CLUSTER METHOD = name < options > ; COPY variables ; ID variable ; VAR variables ; Method=average|ward|centroid|single|complete|median|flexible|mcquitty|eml|density|twostage,分别指定11类系统聚类法。 proc cluster常用选项及语句说明: data= 指定聚类过程的输入数据集。该数据集可以是观测样本(坐标数据),也可以是类型“type=distance”的数据集,数据被认为是类间(或观测间)的距离阵。 关于type=distance的数据集,用如下方式就可建立: data dis_data(type=distance); input a b c; …… 用proc contents等方法可以查看到其“Data Set Type DISTANCE” outtree= 生产一个数据集,存储cluster过程的聚类历史,可被proc tree调用作图。 proc tree主要用于根据proc cluster产生的结果作树状图dendrograms。常用语句如:proc tree data= out= [...]




欢迎光临 SAS中文论坛 (http://www.mysas.net/forum/) Powered by Discuz! X3.2