m:m 合并的问题 (Stata)

Question

我正在尝试合并两个具有不同来源失业率的数据集，第一个数据集的结构如下：

它有 30 多个变量，但我只是将其列为示例。另外，每一次观测都是以一年为单位，埃及是2005年。

year    country Gender  Unemployment
2005    EGY     Female    7.6
2005    EGY     Male      9.2
2005    EGY     Total      .
2006    EGY     Female    7.6
2006    EGY     Male       9
2006    EGY     Total      .

第二个结构如下，但它来自年度调查，因此每个国家/地区每年有三个条目（总计、男性、女性）。每个国家都有 1995-2019 年。

country Gender  year     Unemployment
EGY     Total   2005        12
EGY     Male    2005        7
EGY    Female   2005        17.5

因此，我尝试将这两个数据集与 1:1 和 1:m 合并，对于这两个数据集，我得到： “变量国家年份不能唯一标识主数据中的观察结果”

但是，合并与 m:m 一起工作，如下所示，

merge m:m  country year using "Documents\LMI.dta"

感谢 Nick 的建议，我合并了三元组：

merge 1:1 country year Gender cusing "Documents\LMI.dta"

而且效果很好！

Answer 1

从表面上看，您的数据集由 country year Gender 的三元组标识，因此符合使用这些变量的 merge 1:1 的条件。因此，m:m 合并的缺点似乎是它是完全错误的。

该声明无法解决接下来的任何问题：

Unemployment在这两个集合中都是这样命名的，那么你期望或希望 Stata 做什么？
在您的数据示例中，Unemployment 的值在不同的数据集中是不同的，尽管真实数据可能并非如此。

m:m 合并的问题 (Stata)

Problems with an m:m Merge (Stata)

merge

append

stata