为原始数据集中变量的每个值创建一个包含一个个案的新数据集

Create a new dataset with one case for each value of a variable in the original dataset

我有一个数据集,其中每个案例都是一名学生,我有一个性别变量 (SEX) 和一个专业变量 (MAJOR)。性别变量有 2 个可能值(男性和女性),而专业变量有几十个(生物学、数学等)。

我想使用该数据集创建另一个数据集,其中每个主要有一个案例和 3 个变量:MAJOR、MALE 和 FEMALE。每个专业的变量 MALE 的值应该是该专业注册的男性人数,变量 FEMALE 的值应该是注册该专业的女性人数。 MAJOR 的值应该只是该案例对应的原始数据集中变量 MAJOR 的值的标签。

很明显,当我查看要创建的数据集时,每个专业应该有一行,其中一列 MAJOR 包含每个专业的标签,一列用于 MALE,其中包含注册每个专业的男性和 FEMALE 的一列,其中包含注册每个专业的女性人数。

我的数据集是用 SPSS 创建的,我从未使用过该程序,所以我不知道该怎么做,尽管它可能非常简单。非常感谢您的帮助!

最好的, 菲利普

打开文件后,打开一个新语法 window,将以下代码放入其中 运行:

dataset name OrigFile.
compute male=(SEX="MALE").
compute female=(SEX="FEMALE").
dataset declare NewFile.
aggregate /outfile='NewFile' /break=major /male female=sum(male female).

在此 运行 之后,您将有两个打开的数据集 - 原始数据集和要创建的新数据集。