Python 的大数据操作
Big Data Manipulations with Python
我有这样的数据:
Animal Day Food kg
1 1 17 0.1
1 1 22 0.7
1 2 17 0.8
2 2 15 0.1
我想要 table 看起来像这样:
Animal Food Day1 Day2 ...
1 17 0.1 0.8 ...
1 22 0.7 ...
2 15 0.1
我能够通过复制数据框并合并副本使其在小型数据集上工作。然而,这对我来说似乎效率很低。
所以我想知道如何让它在更大的数据集上工作?
试试 pivot
:
output = df.pivot(["Animal", "Food"], "Day", "kg") \
.add_prefix("Day") \
.reset_index() \
.rename_axis(None, axis=1)
>>> output
Animal Food Day1 Day2
0 1 17 0.1 0.8
1 1 22 0.7 NaN
2 2 15 NaN 0.1
我有这样的数据:
Animal Day Food kg
1 1 17 0.1
1 1 22 0.7
1 2 17 0.8
2 2 15 0.1
我想要 table 看起来像这样:
Animal Food Day1 Day2 ...
1 17 0.1 0.8 ...
1 22 0.7 ...
2 15 0.1
我能够通过复制数据框并合并副本使其在小型数据集上工作。然而,这对我来说似乎效率很低。 所以我想知道如何让它在更大的数据集上工作?
试试 pivot
:
output = df.pivot(["Animal", "Food"], "Day", "kg") \
.add_prefix("Day") \
.reset_index() \
.rename_axis(None, axis=1)
>>> output
Animal Food Day1 Day2
0 1 17 0.1 0.8
1 1 22 0.7 NaN
2 2 15 NaN 0.1