为原始数据集中变量的每个值创建一个包含一个个案的新数据集

Question

我有一个数据集，其中每个案例都是一名学生，我有一个性别变量 (SEX) 和一个专业变量 (MAJOR)。性别变量有 2 个可能值（男性和女性），而专业变量有几十个（生物学、数学等）。

我想使用该数据集创建另一个数据集，其中每个主要有一个案例和 3 个变量：MAJOR、MALE 和 FEMALE。每个专业的变量 MALE 的值应该是该专业注册的男性人数，变量 FEMALE 的值应该是注册该专业的女性人数。 MAJOR 的值应该只是该案例对应的原始数据集中变量 MAJOR 的值的标签。

很明显，当我查看要创建的数据集时，每个专业应该有一行，其中一列 MAJOR 包含每个专业的标签，一列用于 MALE，其中包含注册每个专业的男性和 FEMALE 的一列，其中包含注册每个专业的女性人数。

我的数据集是用 SPSS 创建的，我从未使用过该程序，所以我不知道该怎么做，尽管它可能非常简单。非常感谢您的帮助！

最好的，菲利普

Answer 1

打开文件后，打开一个新语法 window，将以下代码放入其中运行：

dataset name OrigFile.
compute male=(SEX="MALE").
compute female=(SEX="FEMALE").
dataset declare NewFile.
aggregate /outfile='NewFile' /break=major /male female=sum(male female).

在此运行之后，您将有两个打开的数据集 - 原始数据集和要创建的新数据集。

为原始数据集中变量的每个值创建一个包含一个个案的新数据集

Create a new dataset with one case for each value of a variable in the original dataset

spss