计算面板中的缺失值
Count the missing values in panel
我有一个如下所示的数据集:
id A
1 5
1 5
1 .
1 5
5 .
5 .
5 8
13 .
13 .
13 .
13 .
我想在 Stata 的面板中至少不缺少一个 A 值的情况下计算 A 值的数量。
例如,在上面的示例中,有 3 个缺失值不是该面板中唯一的缺失值。
当 id 为 1 时缺少一个 A 值,并且当 id=1 时也有非缺少的 A 值,我想计算那个。
同样,当id为5时有两个缺失的A值,当id=5时也有非缺失值,我也想计算这两个。
当 id=13 时有 4 个缺失的 A 值,但当 id=13 时没有非缺失值,我不想计算这些。
我无法理解,但每个面板中的观察数是
bysort id : gen count = _N
而A
的非缺失值个数为
by id : egen A_nm = count(A)
从中可以通过减法计算缺失值。或者,缺失值可以直接通过
计算
by id: egen A_m = total(missing(A))
如果这没有帮助,您可能需要通过显示您想要的新变量的样子来扩展您的问题。
编辑你想要的可能只是这个的应用:你想查看 A_m
值,条件是 A_nm
为正。
我有一个如下所示的数据集:
id A
1 5
1 5
1 .
1 5
5 .
5 .
5 8
13 .
13 .
13 .
13 .
我想在 Stata 的面板中至少不缺少一个 A 值的情况下计算 A 值的数量。 例如,在上面的示例中,有 3 个缺失值不是该面板中唯一的缺失值。
当 id 为 1 时缺少一个 A 值,并且当 id=1 时也有非缺少的 A 值,我想计算那个。
同样,当id为5时有两个缺失的A值,当id=5时也有非缺失值,我也想计算这两个。
当 id=13 时有 4 个缺失的 A 值,但当 id=13 时没有非缺失值,我不想计算这些。
我无法理解,但每个面板中的观察数是
bysort id : gen count = _N
而A
的非缺失值个数为
by id : egen A_nm = count(A)
从中可以通过减法计算缺失值。或者,缺失值可以直接通过
计算 by id: egen A_m = total(missing(A))
如果这没有帮助,您可能需要通过显示您想要的新变量的样子来扩展您的问题。
编辑你想要的可能只是这个的应用:你想查看 A_m
值,条件是 A_nm
为正。