SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 2462|回复: 4
打印 上一主题 下一主题

多限定条件查重

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2013-2-17 11:05:05 | 只看该作者

多限定条件查重

proc sql noprint;
  create table eds as
  select distinct id,name, date
  from raw;
quit;[/code]

[size=150:3dm2ytmo][color=#FF0000:3dm2ytmo]现条件如下:
1,使用SQL语言,使得var1-var10等10个变量,在查重之后的数据集中需要保留这几个变量;若为四个限定变量呢?
2,data 步可否实现?,求具体的操作过程!![/color:3dm2ytmo][/size:3dm2ytmo]

新年好!祝福工作顺利,身体健康!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2013-2-26 11:33:44 | 只看该作者

Re: 多限定条件查重

期盼大侠现身哦,~~呜呜~~
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
板凳
 楼主| 发表于 2013-2-26 18:48:10 | 只看该作者

Re: 多限定条件查重

你的问题应该不难,关键不知道你在说什么。能非常具体说一下吗?最好举例说明。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
地板
 楼主| 发表于 2013-2-26 22:26:44 | 只看该作者

Re: 多限定条件查重

[quote="MerlinZHOU":3gyxszzd]你的问题应该不难,关键不知道你在说什么。能非常具体说一下吗?最好举例说明。[/quote:3gyxszzd]

关键词,“多条件查重”。
1、如给出的例题第一个记录,只有当date, id, name 三者同时相同时,定义为“石媛”这个人又两条重复的记录,而给出的例题中显然“石媛”这个人的记录为“不重复”;
2、对于第二个记录:
[color=#0080FF:3gyxszzd]2003/2/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1[/color:3gyxszzd]
[color=#FF0000:3gyxszzd]2003/8/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1[/color:3gyxszzd]
2004/2/19   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2005/4/21   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
该记录为重复的记录(实际为一条记录),(彩色标记)需要各删除一条。
不知道我说清楚了没,
现问题是需要用类似于例题给的sql,及data步给出查重的sas程序;
不胜感激~~~
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
5#
 楼主| 发表于 2013-2-27 23:48:09 | 只看该作者

Re: 多限定条件查重

[code:jd8hrwhf]
data raw;
input  date yymmdd10. id $  name $  var1-var10 ;
format    date yymmdd10.;
datalines;
2009/3/5   320283107097   石媛   1   1   1   1   1   1   1   1   1   1
2009/6/4   320283107097   石媛   1   1   1   1   1   1   1   1   1   1
2009/4/16   320283107098   陈泽宇   1   1   1   1   1   1   1   1   1   1
2009/7/30   320283107098   陈泽宇   1   1   1   1   1   1   1   1   1   1
2009/3/19   320283107099   郭战   1   1   1   1   1   1   1   1   1   1
2009/7/15   320283107099   郭战   1   1   1   1   1   1   1   1   1   1
2009/3/5   320283107100   宋羲晨   1   1   1   1   1   1   1   1   1   1
2009/6/18   320283107100   宋羲晨   1   1   1   1   1   1   1   1   1   1
2009/3/2   320523993013   吴王钰洁   1   1   1   1   1   1   1   1   1   1
2009/4/22   320523993013   吴王钰洁   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2004/2/19   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2005/4/21   320583000281   黄晓悦   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2003/2/20   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2003/8/20   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2004/2/19   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2005/4/21   320583000281   黄晓雯   1   1   1   1   1   1   1   1   1   1
2002/9/25   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2003/3/20   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2003/3/20   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2004/5/14   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2005/4/20   320583000560   郭辰幸   1   1   1   1   1   1   1   1   1   1
2003/1/16   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2003/1/16   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2003/7/10   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2003/7/10   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2004/1/15   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
2005/4/22   320583000562   张俊晖   1   1   1   1   1   1   1   1   1   1
;
run;

proc sort data=raw out=one nodupkey;
  by id name date;
run;

data two;
  set one;
  by id name date;
  if first.date;
run;

[/code:jd8hrwhf]
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-5-2 19:10 , Processed in 0.069059 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表