如何使用 python 准备此表单中的数据
How to prepare the data in this form using python
我有 excel 格式如下的数据文件
我想准备以下格式的数据:
我可以使用 python 执行此操作吗?
如果你正在学习数据科学,我建议你使用 Pandas,Python 数据科学堆栈中一个非常重要的库。
Pandas 可以读取多种文件格式,包括 excel,并将它们转换为称为 DataFrame
的内部格式。然后,您可以对 DataFrame
对象执行许多操作,包括统计、绘图和分析。
您正在寻找的通用技术称为 unpivoting,它在 DataFrame
的方法 melt 中可用。
这是一个代码片段,您可以根据自己的需要随意更改它。
import pandas as pd
df_orig = pd.read_excel("YOUR_FILE.xlsx")
attributes = ["color", "liquid"]
df_new = df_orig.melt(id_vars=attributes)
顺便说一句,你真的应该考虑一下你想在 melt
的 id_vars
参数中包含哪些原始变量。通常,只有分类变量用于旋转和反旋转。因此,在您的示例中,我会使用 color
和 liquid
,但如果它是数值变量,我可能不会使用 size
。如果它是分类序数变量,您可以使用 size
。
我有 excel 格式如下的数据文件
我想准备以下格式的数据:
我可以使用 python 执行此操作吗?
如果你正在学习数据科学,我建议你使用 Pandas,Python 数据科学堆栈中一个非常重要的库。
Pandas 可以读取多种文件格式,包括 excel,并将它们转换为称为 DataFrame
的内部格式。然后,您可以对 DataFrame
对象执行许多操作,包括统计、绘图和分析。
您正在寻找的通用技术称为 unpivoting,它在 DataFrame
的方法 melt 中可用。
这是一个代码片段,您可以根据自己的需要随意更改它。
import pandas as pd
df_orig = pd.read_excel("YOUR_FILE.xlsx")
attributes = ["color", "liquid"]
df_new = df_orig.melt(id_vars=attributes)
顺便说一句,你真的应该考虑一下你想在 melt
的 id_vars
参数中包含哪些原始变量。通常,只有分类变量用于旋转和反旋转。因此,在您的示例中,我会使用 color
和 liquid
,但如果它是数值变量,我可能不会使用 size
。如果它是分类序数变量,您可以使用 size
。