在 Stata 中使用 if 语句对子样本数据进行局部宏

Local macro on subsample data using if statement in Stata

我想在 Stata 中使用 local 命令来存储几个变量,之后我想将这些变量导出为两个子样本。我通过分组变量 grouping_var 分隔数据集,它是 0 或 1。我试过:

if grouping_var==0 local vars_0 var1 var2 var3 var4
preserve
keep `vars_0'
saveold "data1", replace
restore

if grouping_var==1 local vars_1 var1 var2 var3 var4
preserve
keep `vars_1'
saveold "data2", replace
restore

然而,输出并不像我预期的那样,数据没有分成两个子样本。第一个列表包括整个数据集。我在这里使用 if 语句有什么问题吗?

这里的 "if qualifier" 和 "if command" 有点混淆。语法 if (condition) (command) 是 "if command",并且在使用观察级逻辑条件编写时通常不会提供所需的行为。

简而言之,Stata 对第一个观察值进行 if (condition) 评估,这就是为什么您的整个数据集在第一个块中 kept/saved( ,按照您当前的排序顺序,grouping_var[1] == 0)。有关详细信息,请参阅 http://www.stata.com/support/faqs/programming/if-command-versus-if-qualifier/

假设您想在每种情况下保留 不同的 个变量,类似下面的代码应该可以工作:

local vars_0 var1 var2 var3 var4
local vars_1 var5 var6 var7 var8
forvalues g = 0/1 {
    preserve
        keep if grouping_var == `g'
        keep `vars_`g''
        save data`g' , replace
    restore
}