SAS中文论坛

标题: 多限定条件查重 [打印本页]

作者: shiyiming    时间: 2013-2-17 11:05
标题: 多限定条件查重
proc sql noprint;
  create table eds as
  select distinct id,name, date
  from raw;
quit;[/code]

[size=150:3dm2ytmo][color=#FF0000:3dm2ytmo]现条件如下:
1,使用SQL语言,使得var1-var10等10个变量,在查重之后的数据集中需要保留这几个变量;若为四个限定变量呢?
2,data 步可否实现?,求具体的操作过程!![/color:3dm2ytmo][/size:3dm2ytmo]

新年好!祝福工作顺利,身体健康!
作者: shiyiming    时间: 2013-2-26 11:33
标题: Re: 多限定条件查重
期盼大侠现身哦,~~呜呜~~
作者: shiyiming    时间: 2013-2-26 18:48
标题: Re: 多限定条件查重
你的问题应该不难,关键不知道你在说什么。能非常具体说一下吗?最好举例说明。
作者: shiyiming    时间: 2013-2-26 22:26
标题: Re: 多限定条件查重
[quote="MerlinZHOU":3gyxszzd]你的问题应该不难,关键不知道你在说什么。能非常具体说一下吗?最好举例说明。[/quote:3gyxszzd]

关键词,“多条件查重”。
1、如给出的例题第一个记录,只有当date, id, name 三者同时相同时,定义为“石媛”这个人又两条重复的记录,而给出的例题中显然“石媛”这个人的记录为“不重复”;
2、对于第二个记录:
[color=#0080FF:3gyxszzd]2003/2/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1[/color:3gyxszzd]
[color=#FF0000:3gyxszzd]2003/8/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1[/color:3gyxszzd]
2004/2/19   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2005/4/21   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
该记录为重复的记录(实际为一条记录),(彩色标记)需要各删除一条。
不知道我说清楚了没,
现问题是需要用类似于例题给的sql,及data步给出查重的sas程序;
不胜感激~~~
作者: shiyiming    时间: 2013-2-27 23:48
标题: Re: 多限定条件查重
[code:jd8hrwhf]
data raw;
input  date yymmdd10. id $  name $  var1-var10 ;
format    date yymmdd10.;
datalines;
2009/3/5   320283107097   石媛   1   1   1   1   1   1   1   1   1   1
2009/6/4   320283107097   石媛   1   1   1   1   1   1   1   1   1   1
2009/4/16   320283107098   陈泽宇   1   1   1   1   1   1   1   1   1   1
2009/7/30   320283107098   陈泽宇   1   1   1   1   1   1   1   1   1   1
2009/3/19   320283107099   郭战   1   1   1   1   1   1   1   1   1   1
2009/7/15   320283107099   郭战   1   1   1   1   1   1   1   1   1   1
2009/3/5   320283107100   宋羲晨   1   1   1   1   1   1   1   1   1   1
2009/6/18   320283107100   宋羲晨   1   1   1   1   1   1   1   1   1   1
2009/3/2   320523993013   吴王钰洁   1   1   1   1   1   1   1   1   1   1
2009/4/22   320523993013   吴王钰洁   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2004/2/19   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2005/4/21   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2004/2/19   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2005/4/21   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2002/9/25   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2003/3/20   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2003/3/20   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2004/5/14   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2005/4/20   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2003/1/16   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2003/1/16   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2003/7/10   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2003/7/10   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2004/1/15   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2005/4/22   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
;
run;

proc sort data=raw out=one nodupkey;
  by id name date;
run;

data two;
  set one;
  by id name date;
  if first.date;
run;

[/code:jd8hrwhf]




欢迎光临 SAS中文论坛 (http://www.mysas.net/forum/) Powered by Discuz! X3.2