m:m 合并的问题 (Stata)

Problems with an m:m Merge (Stata)

我正在尝试合并两个具有不同来源失业率的数据集,第一个数据集的结构如下:

它有 30 多个变量,但我只是将其列为示例。另外,每一次观测都是以一年为单位,埃及是2005年。

year    country Gender  Unemployment
2005    EGY     Female    7.6
2005    EGY     Male      9.2
2005    EGY     Total      .
2006    EGY     Female    7.6
2006    EGY     Male       9
2006    EGY     Total      .

第二个结构如下,但它来自年度调查,因此每个国家/地区每年有三个条目(总计、男性、女性)。每个国家都有 1995-2019 年。

country Gender  year     Unemployment
EGY     Total   2005        12
EGY     Male    2005        7
EGY    Female   2005        17.5

因此,我尝试将这两个数据集与 1:1 和 1:m 合并,对于这两个数据集,我得到: “变量国家年份不能唯一标识主数据中的观察结果”

但是,合并与 m:m 一起工作,如下所示,

merge m:m  country year using "Documents\LMI.dta"

感谢 Nick 的建议,我合并了三元组:

merge 1:1 country year Gender cusing "Documents\LMI.dta"

而且效果很好!

从表面上看,您的数据集由 country year Gender 的三元组标识,因此符合使用这些变量的 merge 1:1 的条件。因此,m:m 合并的缺点似乎是它是完全错误的。

该声明无法解决接下来的任何问题:

  1. Unemployment在这两个集合中都是这样命名的,那么你期望或希望 Stata 做什么?

  2. 在您的数据示例中,Unemployment 的值在不同的数据集中是不同的,尽管真实数据可能并非如此。