如何使用 python 准备此表单中的数据

How to prepare the data in this form using python

我有 excel 格式如下的数据文件

我想准备以下格式的数据:

我可以使用 python 执行此操作吗?

如果你正在学习数据科学,我建议你使用 Pandas,Python 数据科学堆栈中一个非常重要的库。 Pandas 可以读取多种文件格式,包括 excel,并将它们转换为称为 DataFrame 的内部格式。然后,您可以对 DataFrame 对象执行许多操作,包括统计、绘图和分析。 您正在寻找的通用技术称为 unpivoting,它在 DataFrame 的方法 melt 中可用。 这是一个代码片段,您可以根据自己的需要随意更改它。

import pandas as pd


df_orig = pd.read_excel("YOUR_FILE.xlsx")

attributes = ["color", "liquid"]
df_new = df_orig.melt(id_vars=attributes)

顺便说一句,你真的应该考虑一下你想在 meltid_vars 参数中包含哪些原始变量。通常,只有分类变量用于旋转和反旋转。因此,在您的示例中,我会使用 colorliquid,但如果它是数值变量,我可能不会使用 size。如果它是分类序数变量,您可以使用 size