SAS中文论坛

标题: 请教大虾一个数据处理的问题 [打印本页]

作者: shiyiming    时间: 2012-6-11 15:08
标题: 请教大虾一个数据处理的问题
比如有如下一个数据集:
data test;
input x $;
cards;
123
a123
abc
;
run;

需求是:对于全部是数字的返回值1,否则返回0,所以上面数据集第一行返回1,第二行和第三行返回0,最后数据集结构如下:
x    flag
123 1
a12 0
abc 0

请高手指教!
作者: shiyiming    时间: 2012-6-11 15:41
标题: Re: 请教大虾一个数据处理的问题
[code:2r8vkewy]data test;
    input x $;
    flag=prxmatch("/^(-?\d+)(\.\d+)?$/",strip(x));
cards;
123
a12
abc
;[/code:2r8vkewy]
作者: shiyiming    时间: 2012-6-11 20:51
标题: Re: 请教大虾一个数据处理的问题
data test1;
set test;
y=x+0;
if y=. then y=0;
else y=1;
run;
作者: shiyiming    时间: 2012-6-12 11:27
标题: Re: 请教大虾一个数据处理的问题
感谢二位精彩回复,@Hopewell, 我想请教一下flag=prxmatch("/^(-?\d+)(\.\d+)?$/",strip(x)),能否具体解释一下正则表达式函数prxmatch里面每一个符号的含义?非常感谢!
作者: shiyiming    时间: 2012-6-12 12:37
标题: Re: 请教大虾一个数据处理的问题
两个slash是delimiter,标识之间内容为所需的pattern
caret代表head of string
dollar代表end of string
()之间是一个subpattern
?代表非贪婪匹配(non-greedy),也代表之前的pattern出现0次或者1次
\d代表number
+代表之前的pattern出现一次及一次以上
\.因为dot在RE代表任意字符。加上slash用来escape,代表真正的dot

因此
(-?\d+) hyphen之后用了“?”来表示正负数
(\.\d+) 代表小数点及小数部分,这个pattern可以有可以无,所以之后用了"?",来代表出现0次或一次。
套上^$代表string只包含所需要的pattern,patterns之外不可有其他字符
作者: shiyiming    时间: 2012-6-12 14:28
标题: Re: 请教大虾一个数据处理的问题
多谢yating, 还有一个小问题:请问(-?\d+) 里面的“-?”表示什么意思?代表正负号吗?
作者: shiyiming    时间: 2012-6-12 14:34
标题: Re: 请教大虾一个数据处理的问题
-?代表-可以出现0次或者一次,0次即正数,1次即负数
作者: shiyiming    时间: 2012-6-12 14:50
标题: Re: 请教大虾一个数据处理的问题
学习了!能否在请教下面这个正则表达式? "/(\d+):(\d\d)(?:\.(\d+))?/". 请问这个正则表达式里面的两个'?'分别匹配前面的哪个子表达式? 第一个'?'是匹配前面的'('吗?第二个呢?多谢yating!
作者: shiyiming    时间: 2012-6-12 15:25
标题: Re: 请教大虾一个数据处理的问题
?:代表不捕获匹配的subpattern。因此这里虽然有四对(),最终可以捕获以并后用的只有三对(只有replace才会用到,不必care)。
第二个问号即对(?:\.(\d+))做出现次数的限制,其中?:如前面提到是一种syntax,不是用来匹配正文的pattern,所以限制的pattern其实是\.\d+
即这个re能匹配这样的string,以冒号分割成两部分,第一部分为任意大小number,不含负数。第二部分为正两位数,可以是整数,也可以包含额外的小数。
作者: shiyiming    时间: 2012-6-12 16:38
标题: Re: 请教大虾一个数据处理的问题
高,实在是高!感谢yating! 我还有一个小问题:既然?:代表不捕获匹配的subpattern,那放在"/(\d+):(\d\d)(?:\.(\d+))?/"有什么目的?如果用"/(\d+):(\d\d)(\.(\d+))?/"来替代"/(\d+):(\d\d)(?:\.(\d+))?/",效果是等价的吗?再次感谢!
作者: shiyiming    时间: 2012-6-12 19:45
标题: Re: 请教大虾一个数据处理的问题
等价的。个人认为这段可能是从别的地方摘取的,对于捕获和非捕获,只有之后使用类似replace的逆向操作才会去care。在这个case上是没有关系
还有我是yatming不是yating,谢谢。




欢迎光临 SAS中文论坛 (http://www.mysas.net/forum/) Powered by Discuz! X3.2