SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 1289|回复: 0
打印 上一主题 下一主题

SAS多元分析之判别(1)–proc discrim

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2012-1-8 13:14:33 | 只看该作者

SAS多元分析之判别(1)–proc discrim

From hssnow's blog on hssnow.name

  本文主要对SAS做判别分析的proc discrim步的应用做一个简单的摘录,相关的理论知识细节,请参见SAS help文档及其他统计学相关文献等。 1.简介 判别分式是判断样本所属类别的一种统计方法,常用的判别分析法有: 距离判别法:首先定义新样本到总体的距离,然后考察样本到各个总体的距离,把新样本判归至与其距离最近的总体。常用距离使用马氏距离。 贝叶斯(Bayes)判别法:更具Bayes统计思想,计算新样本属于各个总体的条件概率,比较各个条件概率的大小,将新样本判归至条件概率最大的总体。 Fisher判别法:是一种先进行高维向低位投影,再根据距离判别的一种方法。借助方差分析的思想构造判别函数(相当于一种投影),使组间区别最大、组内离差最小,然后代入新样本数据,将其与判别临界值比较以确定应判为至哪一总体。 逐步判别法:主要是利用一些检验规则,对变量进行逐步筛选,同时进行判别的一种方法。 SAS中的proc discrim(判别归类过程)可以实现:距离判别法,贝叶斯(Bayes)判别法,Fisher判别法(典型判别)。 在proc discrim中,当各总体为正态总体是,距离判别是Bayes判别的特殊形式。 2.proc discrim 常用语法格式: PROC DISCRIM < options > ; CLASS variable ; PRIORS probabilities ; VAR variables ; discrim常用选项及说明: data= 指定欲分析的数据集 testdata= 指定待判数据集,其中必须有“var”语句指定的所有判别变量。同时,还可使用“testout=”和“testoutd=”选项指定存储分类结果和组密度估计的数据集。 out= 指定生成一个数据集,其包含来自“data=”的所有数据、每个观测来自不同组的后验概率及判别结果。 outstat= 指定生成一个数据集,其包含分析过程中的各个统计量。 manova 各总体均值差异的显著性检验。对于k各已知总体,若 ,那么k个总体是不可区分的,判别分析就失去了意义。所以需进行差异显著性检验。 method=normal|npar 指定参数或非参数判别法。normal参数法为缺省项。参数方法:假定每组都服从多元正态分布,采用广义平方距离的量度得出判别函数或分类准则,其是基于组内协差阵或合并协差阵的。非参数方法:不要求正态分布,其基于组概率密度,采用核方法或k最近邻方法得到非参数估计。缺省条件下,proc discrim认为个总体皆为正态总体,采用参数判别法。当我们不能确定各总体为正态时,一般应该有非参数判别法。 pool=yes|no|test 决定计算马氏距离时协差阵的选取。使用马氏距离进行判别时,需要估计总体协差阵 ;实际判别问题中,一般只知道来自k个总体的样本总体的样本,而不知道各总体均值和协差阵。当 时用合并样本协差阵 估计总体协差阵。当 不全相等时,用组内样本协差阵 估计总体 协差阵。选项yes为默认,要求用合并样本协差阵PCOV(pooled [...]
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-5-6 23:26 , Processed in 0.093074 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表