Python 的大数据操作

Big Data Manipulations with Python

我有这样的数据:

Animal Day Food kg
1      1   17   0.1
1      1   22   0.7
1      2   17   0.8
2      2   15   0.1

我想要 table 看起来像这样:

Animal Food Day1 Day2 ...
1      17   0.1  0.8  ...
1      22   0.7       ...
2      15        0.1

我能够通过复制数据框并合并副本使其在小型数据集上工作。然而,这对我来说似乎效率很低。 所以我想知道如何让它在更大的数据集上工作?

试试 pivot:

output = df.pivot(["Animal", "Food"], "Day", "kg") \
           .add_prefix("Day") \
           .reset_index() \
           .rename_axis(None, axis=1)

>>> output
   Animal  Food  Day1  Day2
0       1    17   0.1   0.8
1       1    22   0.7   NaN
2       2    15   NaN   0.1