估计边际效应时出错
Error while estimating marginal effects
我在 Stata 15 中检索拟合逻辑回归模型的边际效应时遇到问题。结果变量 mathtsbv
是二元的,性别变量 sex
也是虚拟的并且记录了种族 eth
变量是分类变量,值范围从 0 到 5。所有缺失值均已排除。
这是我的 do-file 的摘录:
logit mathtsbv sex eth sex##i.eth if (mathtsbv>=0&mathtsbv<.)&(sex>=0&sex<.)&(eth>=0ð<.)
margins, dydx(sex eth sex##i.eth) atmeans
这是我在 Stata 日志中得到的错误:
. margins, dydx(sex eth sex##i.eth) atmeans
invalid dydx() option;
variable sex may not be present in model as factor and continuous predictor
我花了一个多小时在谷歌上搜索和试验:从模型中删除 sex
并仅保留 eth
,并向预测变量列表添加一个连续变量。不幸的是 none 解决了问题。
您可以计算平均边际效应的对比,这将使您得到与您想要的类似的东西:当您改变一个变量时,成功概率的变化如何随着第二个变量的变化而变化。
这是 Stata 中的一个可复制示例:
. webuse lbw, clear
(Hosmer & Lemeshow data)
. qui logit low i.smoke##i.race
. margins r.smoke#r.race
Contrasts of adjusted predictions
Model VCE : OIM
Expression : Pr(low), predict()
---------------------------------------------------------------------------
| df chi2 P>chi2
----------------------------------------+----------------------------------
smoke#race |
(smoker vs nonsmoker) (black vs white) | 1 0.00 0.9504
(smoker vs nonsmoker) (other vs white) | 1 1.59 0.2070
Joint | 2 1.67 0.4332
---------------------------------------------------------------------------
-----------------------------------------------------------------------------------------
| Delta-method
| Contrast Std. Err. [95% Conf. Interval]
----------------------------------------+------------------------------------------------
smoke#race |
(smoker vs nonsmoker) (black vs white) | .0130245 .2092014 -.3970027 .4230517
(smoker vs nonsmoker) (other vs white) | -.2214452 .1754978 -.5654146 .1225242
-----------------------------------------------------------------------------------------
例如,与白人相比,吸烟对其他人 child 低体重概率的影响要低 22 个百分点。这种差异并不显着。
这些结果与使用完全饱和的 OLS 模型得到的结果相同,您可以在其中直接解释交互系数:
. reg low i.smoke##i.race, robust
Linear regression Number of obs = 189
F(5, 183) = 5.09
Prob > F = 0.0002
R-squared = 0.0839
Root MSE = .45072
-------------------------------------------------------------------------------
| Robust
low | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------------+----------------------------------------------------------------
smoke |
smoker | .2744755 .0809029 3.39 0.001 .1148531 .4340979
|
race |
black | .2215909 .1257293 1.76 0.080 -.0264745 .4696563
other | .2727273 .0792791 3.44 0.001 .1163086 .4291459
|
smoke#race |
smoker#black | .0130245 .2126033 0.06 0.951 -.4064443 .4324933
smoker#other | -.2214452 .1783516 -1.24 0.216 -.5733351 .1304447
|
_cons | .0909091 .044044 2.06 0.040 .0040098 .1778083
-------------------------------------------------------------------------------
我在 Stata 15 中检索拟合逻辑回归模型的边际效应时遇到问题。结果变量 mathtsbv
是二元的,性别变量 sex
也是虚拟的并且记录了种族 eth
变量是分类变量,值范围从 0 到 5。所有缺失值均已排除。
这是我的 do-file 的摘录:
logit mathtsbv sex eth sex##i.eth if (mathtsbv>=0&mathtsbv<.)&(sex>=0&sex<.)&(eth>=0ð<.)
margins, dydx(sex eth sex##i.eth) atmeans
这是我在 Stata 日志中得到的错误:
. margins, dydx(sex eth sex##i.eth) atmeans
invalid dydx() option;
variable sex may not be present in model as factor and continuous predictor
我花了一个多小时在谷歌上搜索和试验:从模型中删除 sex
并仅保留 eth
,并向预测变量列表添加一个连续变量。不幸的是 none 解决了问题。
您可以计算平均边际效应的对比,这将使您得到与您想要的类似的东西:当您改变一个变量时,成功概率的变化如何随着第二个变量的变化而变化。
这是 Stata 中的一个可复制示例:
. webuse lbw, clear
(Hosmer & Lemeshow data)
. qui logit low i.smoke##i.race
. margins r.smoke#r.race
Contrasts of adjusted predictions
Model VCE : OIM
Expression : Pr(low), predict()
---------------------------------------------------------------------------
| df chi2 P>chi2
----------------------------------------+----------------------------------
smoke#race |
(smoker vs nonsmoker) (black vs white) | 1 0.00 0.9504
(smoker vs nonsmoker) (other vs white) | 1 1.59 0.2070
Joint | 2 1.67 0.4332
---------------------------------------------------------------------------
-----------------------------------------------------------------------------------------
| Delta-method
| Contrast Std. Err. [95% Conf. Interval]
----------------------------------------+------------------------------------------------
smoke#race |
(smoker vs nonsmoker) (black vs white) | .0130245 .2092014 -.3970027 .4230517
(smoker vs nonsmoker) (other vs white) | -.2214452 .1754978 -.5654146 .1225242
-----------------------------------------------------------------------------------------
例如,与白人相比,吸烟对其他人 child 低体重概率的影响要低 22 个百分点。这种差异并不显着。
这些结果与使用完全饱和的 OLS 模型得到的结果相同,您可以在其中直接解释交互系数:
. reg low i.smoke##i.race, robust
Linear regression Number of obs = 189
F(5, 183) = 5.09
Prob > F = 0.0002
R-squared = 0.0839
Root MSE = .45072
-------------------------------------------------------------------------------
| Robust
low | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------------+----------------------------------------------------------------
smoke |
smoker | .2744755 .0809029 3.39 0.001 .1148531 .4340979
|
race |
black | .2215909 .1257293 1.76 0.080 -.0264745 .4696563
other | .2727273 .0792791 3.44 0.001 .1163086 .4291459
|
smoke#race |
smoker#black | .0130245 .2126033 0.06 0.951 -.4064443 .4324933
smoker#other | -.2214452 .1783516 -1.24 0.216 -.5733351 .1304447
|
_cons | .0909091 .044044 2.06 0.040 .0040098 .1778083
-------------------------------------------------------------------------------