|
楼主

楼主 |
发表于 2011-6-8 03:06:51
|
只看该作者
请教关于变量记数问题
恩, 有这样一组数据:2层CLUSTER,想统计每一层CLUSTER里连续的同样变量有多少,部分数据如下:
id visit time measurement
1 1 10:10 100
1 1 10:11 100
1 1 10:12 100
1 1 10:14 200
1 1 10:17 200
1 1 10:18 100
1 2 10:11 100
1 2 10:16 100
2 1 11:10 20
2 1 11:13 20
要转换成:
id visit time measurement dup
1 1 10:10 100 2
1 1 10:14 200 1
1 1 10:18 100 0
1 2 10:11 100 1
2 1 11:10 20 1
最麻烦的是要求不连续的同值量不能归纳在一起, 比如从10:10到10:12有3个值为100的值,则有2个DUPLICATE的值,而10:18的100的值就要分开因为中间有200的测量值.
原始数据很大,哪位前辈知道这样的情况可以如何处理?
这里先谢过了~ |
|