SAS中文论坛
标题:
多限定条件查重
[打印本页]
作者:
shiyiming
时间:
2013-2-17 11:05
标题:
多限定条件查重
proc sql noprint;
create table eds as
select distinct id,name, date
from raw;
quit;[/code]
[size=150:3dm2ytmo][color=#FF0000:3dm2ytmo]现条件如下:
1,使用SQL语言,使得var1-var10等10个变量,在查重之后的数据集中需要保留这几个变量;若为四个限定变量呢?
2,data 步可否实现?,求具体的操作过程!![/color:3dm2ytmo][/size:3dm2ytmo]
新年好!祝福工作顺利,身体健康!
作者:
shiyiming
时间:
2013-2-26 11:33
标题:
Re: 多限定条件查重
期盼大侠现身哦,~~呜呜~~
作者:
shiyiming
时间:
2013-2-26 18:48
标题:
Re: 多限定条件查重
你的问题应该不难,关键不知道你在说什么。能非常具体说一下吗?最好举例说明。
作者:
shiyiming
时间:
2013-2-26 22:26
标题:
Re: 多限定条件查重
[quote="MerlinZHOU":3gyxszzd]你的问题应该不难,关键不知道你在说什么。能非常具体说一下吗?最好举例说明。[/quote:3gyxszzd]
关键词,“多条件查重”。
1、如给出的例题第一个记录,只有当date, id, name 三者同时相同时,定义为“石媛”这个人又两条重复的记录,而给出的例题中显然“石媛”这个人的记录为“不重复”;
2、对于第二个记录:
[color=#0080FF:3gyxszzd]2003/2/20 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
2003/2/20 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1[/color:3gyxszzd]
[color=#FF0000:3gyxszzd]2003/8/20 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
2003/8/20 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1[/color:3gyxszzd]
2004/2/19 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
2005/4/21 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
该记录为重复的记录(实际为一条记录),(彩色标记)需要各删除一条。
不知道我说清楚了没,
现问题是需要用类似于例题给的sql,及data步给出查重的sas程序;
不胜感激~~~
作者:
shiyiming
时间:
2013-2-27 23:48
标题:
Re: 多限定条件查重
[code:jd8hrwhf]
data raw;
input date yymmdd10. id $ name $ var1-var10 ;
format date yymmdd10.;
datalines;
2009/3/5 320283107097 石媛 1 1 1 1 1 1 1 1 1 1
2009/6/4 320283107097 石媛 1 1 1 1 1 1 1 1 1 1
2009/4/16 320283107098 陈泽宇 1 1 1 1 1 1 1 1 1 1
2009/7/30 320283107098 陈泽宇 1 1 1 1 1 1 1 1 1 1
2009/3/19 320283107099 郭战 1 1 1 1 1 1 1 1 1 1
2009/7/15 320283107099 郭战 1 1 1 1 1 1 1 1 1 1
2009/3/5 320283107100 宋羲晨 1 1 1 1 1 1 1 1 1 1
2009/6/18 320283107100 宋羲晨 1 1 1 1 1 1 1 1 1 1
2009/3/2 320523993013 吴王钰洁 1 1 1 1 1 1 1 1 1 1
2009/4/22 320523993013 吴王钰洁 1 1 1 1 1 1 1 1 1 1
2003/2/20 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
2003/2/20 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
2003/8/20 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
2003/8/20 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
2004/2/19 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
2005/4/21 320583000281 黄晓悦 1 1 1 1 1 1 1 1 1 1
2003/2/20 320583000281 黄晓雯 1 1 1 1 1 1 1 1 1 1
2003/2/20 320583000281 黄晓雯 1 1 1 1 1 1 1 1 1 1
2003/8/20 320583000281 黄晓雯 1 1 1 1 1 1 1 1 1 1
2003/8/20 320583000281 黄晓雯 1 1 1 1 1 1 1 1 1 1
2004/2/19 320583000281 黄晓雯 1 1 1 1 1 1 1 1 1 1
2005/4/21 320583000281 黄晓雯 1 1 1 1 1 1 1 1 1 1
2002/9/25 320583000560 郭辰幸 1 1 1 1 1 1 1 1 1 1
2003/3/20 320583000560 郭辰幸 1 1 1 1 1 1 1 1 1 1
2003/3/20 320583000560 郭辰幸 1 1 1 1 1 1 1 1 1 1
2004/5/14 320583000560 郭辰幸 1 1 1 1 1 1 1 1 1 1
2005/4/20 320583000560 郭辰幸 1 1 1 1 1 1 1 1 1 1
2003/1/16 320583000562 张俊晖 1 1 1 1 1 1 1 1 1 1
2003/1/16 320583000562 张俊晖 1 1 1 1 1 1 1 1 1 1
2003/7/10 320583000562 张俊晖 1 1 1 1 1 1 1 1 1 1
2003/7/10 320583000562 张俊晖 1 1 1 1 1 1 1 1 1 1
2004/1/15 320583000562 张俊晖 1 1 1 1 1 1 1 1 1 1
2005/4/22 320583000562 张俊晖 1 1 1 1 1 1 1 1 1 1
;
run;
proc sort data=raw out=one nodupkey;
by id name date;
run;
data two;
set one;
by id name date;
if first.date;
run;
[/code:jd8hrwhf]
欢迎光临 SAS中文论坛 (http://www.mysas.net/forum/)
Powered by Discuz! X3.2