SAS中文论坛

标题: 求助 关于proc Cluster分组 [打印本页]

作者: shiyiming    时间: 2012-4-14 17:54
标题: 求助 关于proc Cluster分组
现在有一组数据需要进行聚类分析,需要满足距离矩阵 dij = sqrt(2*(1-cij))
其中dij是距离矩阵中的元素;
cij表示数据集中两个变量间的相关系数,来自于通过数据集不同变量间计算corr 矩阵中的对应元素。

比如 数据集A:

x    y    z                                                                                x    y    z
1    4    5                可以计算得到一个corr矩阵                     x   1   *   *
3    1    2             ===================>                           y   *    1    *
5    3    8                                                                           z    *   *     1

现在我要计算这个距离矩阵用于proc cluster,但是我不知道这个距离矩阵该怎么算比较好,如果用proc corr + proc iml 算效率会不会很差,因为我要算几百次这样的聚类。

好像proc distance能算这个矩阵,但是我不确定能不能直接用这个距离关系。

[b:bbhsd31x]大家有没有别的方法可以计算出按照上述关系进行的聚类分析?[/b:bbhsd31x]

本人是初学者,希望各位高手多多帮忙。

谢谢




欢迎光临 SAS中文论坛 (http://www.mysas.net/forum/) Powered by Discuz! X3.2