将特征添加到必须使用转换公式映射其分类值的“数字”数据集
Add features to the “numeric” dataset whose categorical value must be mapped using a conversion formula
我有这个数据集:
这是请求:
“将 Mjob 和 Fjob 属性添加到“数字”数据集,其分类值必须使用您选择的转换公式进行映射。”
有人知道怎么做吗?
例如:如果 'at_home' 值在 Mjob 中变为“1”,我希望在 Fjob 列中得到相同的结果。相同的分类值必须具有相同的整数值转换。
谢谢大家
您可以使用 map
函数和 pandas Series/Column 将分类变量从字符串数据映射到数值数据。例如,使用以下 pandas 数据框:
data = np.array([
['at_home','teacher'],
['at_home','other'],
['at_home','other'],
['health', 'services']
])
df = pd.DataFrame(data=data, columns=['Mjob', 'Fjob'])
使用 map
函数创建了两个新列
map_dict = {'at_home':1, 'teacher':2, 'other':3, 'health':4, 'services':5}
df['Mjob_numeric'] = df['Mjob'].map(map_dict)
df['Fjob_numeric'] = df['Fjob'].map(map_dict)
我有这个数据集:
这是请求: “将 Mjob 和 Fjob 属性添加到“数字”数据集,其分类值必须使用您选择的转换公式进行映射。”
有人知道怎么做吗? 例如:如果 'at_home' 值在 Mjob 中变为“1”,我希望在 Fjob 列中得到相同的结果。相同的分类值必须具有相同的整数值转换。
谢谢大家
您可以使用 map
函数和 pandas Series/Column 将分类变量从字符串数据映射到数值数据。例如,使用以下 pandas 数据框:
data = np.array([
['at_home','teacher'],
['at_home','other'],
['at_home','other'],
['health', 'services']
])
df = pd.DataFrame(data=data, columns=['Mjob', 'Fjob'])
使用 map
函数创建了两个新列
map_dict = {'at_home':1, 'teacher':2, 'other':3, 'health':4, 'services':5}
df['Mjob_numeric'] = df['Mjob'].map(map_dict)
df['Fjob_numeric'] = df['Fjob'].map(map_dict)