如何提取列的唯一值及其计数并使用索引键存储在数据框中
how to extract the unique values and its count of a column and store in data frame with index key
我是pandas.I的新手,有一个简单的问题:
如何提取列的唯一值及其计数并使用索引键存储在数据框中
我尝试过:
df = df1['Genre'].value_counts()
我正在获取一个系列,但我不知道如何将其转换为数据框对象。
尝试
df = pd.DataFrame(df1['Genre'].value_counts())
Pandas系列有一个.to_frame()
功能。试一试:
df = df1['Genre'].value_counts().to_frame()
如果您想 "switch" 行到列:
df = df1['Genre'].value_counts().to_frame().T
更新:完整示例,如果您希望它们作为列:
import pandas as pd
import numpy as np
np.random.seed(400) # To reproduce random variables
df1 = pd.DataFrame({
'Genre': np.random.choice(['Comedy','Drama','Thriller'], size=10)
})
df = df1['Genre'].value_counts().to_frame().T
print(df)
Returns:
Thriller Comedy Drama
Genre 5 3 2
我是pandas.I的新手,有一个简单的问题:
如何提取列的唯一值及其计数并使用索引键存储在数据框中
我尝试过:
df = df1['Genre'].value_counts()
我正在获取一个系列,但我不知道如何将其转换为数据框对象。
尝试
df = pd.DataFrame(df1['Genre'].value_counts())
Pandas系列有一个.to_frame()
功能。试一试:
df = df1['Genre'].value_counts().to_frame()
如果您想 "switch" 行到列:
df = df1['Genre'].value_counts().to_frame().T
更新:完整示例,如果您希望它们作为列:
import pandas as pd
import numpy as np
np.random.seed(400) # To reproduce random variables
df1 = pd.DataFrame({
'Genre': np.random.choice(['Comedy','Drama','Thriller'], size=10)
})
df = df1['Genre'].value_counts().to_frame().T
print(df)
Returns:
Thriller Comedy Drama
Genre 5 3 2