R,在面板回归中找到最坏的预测案例

R, finding the worst predicted cases in a panel regression

我正在研究一个解释国家参与国际机构的模型。 在使用随机和内部转换模型进行面板回归后,我想 select 模型预测最差的案例(即国家/地区),以将其用于定性研究。

一个想法是预测每年的国家/地区值,然后将这些结果与实际参与度进行比较,并对一个国家/地区内的总体不匹配进行平均,以找出所有国家/地区的实际值与预测值的最大偏差。 我可以对 plm 模型使用普通的 predict() 函数,还是有不同的方法?

One idea was to predict the country values in each year, then compare those results with the actual participation and average the overall mismatch within one country to find the maximum deviation of real vs. predicted value across all countries. Can I use the normal predict() function for a plm Model

是的,你可以做到。或者您可以直接调查残差。这是一个使用 plm 包附带的 "Produc" 数据集的相关示例:

library(dplyr)  
library(plm)
data("Produc", package = "plm")
zz <- plm(
  log(gsp) ~ log(pcap) + log(pc) + log(emp) + unemp,
  data  = Produc,
  index = c("state","year"))
Produc <- cbind(Produc, resids = zz$residuals)
Produc %>%
  group_by(state) %>%
  summarize(resids.meanAbs = mean(abs(resids))) %>%  # average residuals within states
  .[order(.$resids.meanAbs, decreasing = TRUE),]     # states by largest avg. residual