SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 974|回复: 0
打印 上一主题 下一主题

SAS多元分析之聚类(1)–proc cluster

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2012-1-8 13:14:20 | 只看该作者

SAS多元分析之聚类(1)–proc cluster

From hssnow's blog on hssnow.name

本文主要对SAS做聚类分析的proc cluster步的应用做一个简单的摘录,相关的理论知识细节,请参见SAS help文档及其他统计学相关文献等。 1.简介 proc cluster一般适用于规模较小的样本观测聚类(即Q型聚类)。proc cluster为系统聚类,包括11种方法,根据“距离”作为分类标准。 2.proc cluster 常用语法格式: PROC CLUSTER METHOD = name < options > ; COPY variables ; ID variable ; VAR variables ; Method=average|ward|centroid|single|complete|median|flexible|mcquitty|eml|density|twostage,分别指定11类系统聚类法。 proc cluster常用选项及语句说明: data= 指定聚类过程的输入数据集。该数据集可以是观测样本(坐标数据),也可以是类型“type=distance”的数据集,数据被认为是类间(或观测间)的距离阵。 关于type=distance的数据集,用如下方式就可建立: data dis_data(type=distance); input a b c; …… 用proc contents等方法可以查看到其“Data Set Type DISTANCE” outtree= 生产一个数据集,存储cluster过程的聚类历史,可被proc tree调用作图。 proc tree主要用于根据proc cluster产生的结果作树状图dendrograms。常用语句如:proc tree data= out= [...]
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-5-7 03:15 , Processed in 0.132268 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表