|
楼主

楼主 |
发表于 2012-9-11 00:10:42
|
只看该作者
[程序问答] 想要请教一下如何从代码文件中提取涉及的数据集名和变量名?
不好意思,打扰一下大家,想要请教一个程序:)
自建逻辑库ia中有一百多个数据集;每个数据表中每行是一个观测样本,每列是一个指标;不同数据表的所含指标也不尽相同;
同时,实验室需要用这些数据来做一些分析任务,[b:a8cxpmau]这些分析任务一般只会各自涉及到几个数据集,每个数据集也未必总是使用全部的指标;
最近想统计下这些分析任务中数据表和变量的使用情况[/b:a8cxpmau],
不知怎么用sas写个程序,可以提取并导出如下形式的excel表格?
分析任务名称1 数据表名1 变量名1
分析任务名称1 数据表名1 变量名2
分析任务名称1 数据表名1 变量名3
分析任务名称1 数据表名3 变量名3
分析任务名称1 数据表名3 变量名5
分析任务名称2 数据表名2 变量名3
……
其中,1,每个项目都用sas来做,每个分析任务目都放在一个单独的文件夹下,文件夹下放了相应的sas代码文件(有时一个分析任务里面不止一个代码文件);
2,代码中被引用的数据集名字,可根据set ia.??? 或者sql的select …… from ia.?? 来找出;
3, 被涉及的数据集中的指标,则可根据“keep ?? ?? ??”、“keep=(??,??,……)”、“select ??,??,??,……, from ia.??”来找出(这些分析任务不是同一个人做的,各写作风格不太一致),自定义变量和重命名后的变量新名字就不去提取了
本人sas还处于初学阶段,还望大家不吝赐教:)
比如code1只涉及 data1(变量共100个,但此code只使用了var1 var2 var3)和data3(变量使用了var3 var5)
那么我就整理为
code1 data1 var1
code1 data1 var2
code1 data1 var3
code1 data3 var3
code1 data3 var5
然后再看code2,只涉及了data2(只用了变量var3)
于是我就在之前的输出结果中再补上一行
code2 data2 var3 |
|