SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 2237|回复: 10
打印 上一主题 下一主题

请教大虾一个数据处理的问题

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2012-6-11 15:08:23 | 只看该作者

请教大虾一个数据处理的问题

比如有如下一个数据集:
data test;
input x $;
cards;
123
a123
abc
;
run;

需求是:对于全部是数字的返回值1,否则返回0,所以上面数据集第一行返回1,第二行和第三行返回0,最后数据集结构如下:
x    flag
123 1
a12 0
abc 0

请高手指教!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2012-6-11 15:41:17 | 只看该作者

Re: 请教大虾一个数据处理的问题

[code:2r8vkewy]data test;
    input x $;
    flag=prxmatch("/^(-?\d+)(\.\d+)?$/",strip(x));
cards;
123
a12
abc
;[/code:2r8vkewy]
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
板凳
 楼主| 发表于 2012-6-11 20:51:01 | 只看该作者

Re: 请教大虾一个数据处理的问题

data test1;
set test;
y=x+0;
if y=. then y=0;
else y=1;
run;
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
地板
 楼主| 发表于 2012-6-12 11:27:30 | 只看该作者

Re: 请教大虾一个数据处理的问题

感谢二位精彩回复,@Hopewell, 我想请教一下flag=prxmatch("/^(-?\d+)(\.\d+)?$/",strip(x)),能否具体解释一下正则表达式函数prxmatch里面每一个符号的含义?非常感谢!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
5#
 楼主| 发表于 2012-6-12 12:37:34 | 只看该作者

Re: 请教大虾一个数据处理的问题

两个slash是delimiter,标识之间内容为所需的pattern
caret代表head of string
dollar代表end of string
()之间是一个subpattern
?代表非贪婪匹配(non-greedy),也代表之前的pattern出现0次或者1次
\d代表number
+代表之前的pattern出现一次及一次以上
\.因为dot在RE代表任意字符。加上slash用来escape,代表真正的dot

因此
(-?\d+) hyphen之后用了“?”来表示正负数
(\.\d+) 代表小数点及小数部分,这个pattern可以有可以无,所以之后用了"?",来代表出现0次或一次。
套上^$代表string只包含所需要的pattern,patterns之外不可有其他字符
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
6#
 楼主| 发表于 2012-6-12 14:28:01 | 只看该作者

Re: 请教大虾一个数据处理的问题

多谢yating, 还有一个小问题:请问(-?\d+) 里面的“-?”表示什么意思?代表正负号吗?
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
7#
 楼主| 发表于 2012-6-12 14:34:05 | 只看该作者

Re: 请教大虾一个数据处理的问题

-?代表-可以出现0次或者一次,0次即正数,1次即负数
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
8#
 楼主| 发表于 2012-6-12 14:50:09 | 只看该作者

Re: 请教大虾一个数据处理的问题

学习了!能否在请教下面这个正则表达式? "/(\d+):(\d\d)(?:\.(\d+))?/". 请问这个正则表达式里面的两个'?'分别匹配前面的哪个子表达式? 第一个'?'是匹配前面的'('吗?第二个呢?多谢yating!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
9#
 楼主| 发表于 2012-6-12 15:25:43 | 只看该作者

Re: 请教大虾一个数据处理的问题

?:代表不捕获匹配的subpattern。因此这里虽然有四对(),最终可以捕获以并后用的只有三对(只有replace才会用到,不必care)。
第二个问号即对(?:\.(\d+))做出现次数的限制,其中?:如前面提到是一种syntax,不是用来匹配正文的pattern,所以限制的pattern其实是\.\d+
即这个re能匹配这样的string,以冒号分割成两部分,第一部分为任意大小number,不含负数。第二部分为正两位数,可以是整数,也可以包含额外的小数。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
10#
 楼主| 发表于 2012-6-12 16:38:15 | 只看该作者

Re: 请教大虾一个数据处理的问题

高,实在是高!感谢yating! 我还有一个小问题:既然?:代表不捕获匹配的subpattern,那放在"/(\d+):(\d\d)(?:\.(\d+))?/"有什么目的?如果用"/(\d+):(\d\d)(\.(\d+))?/"来替代"/(\d+):(\d\d)(?:\.(\d+))?/",效果是等价的吗?再次感谢!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-5-6 14:10 , Processed in 0.072098 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表