从 pandas 中的文本文件为 DataFrame 创建特征

Question

我希望使用 feature_names.txt 使用以下代码为数据框创建特征：

import pandas as pd
features = pd.read_csv("feature_names.txt", header= None)
dataset = pd.read_csv("dataset.csv")
dataset.columns = features.values

这会输出以下内容：

(id ,) (年龄,) (工种,) (fnlwgt,) (教育,) (education-num,) (marital-status,) (职业,) (关系,)

我想删除括号和逗号，但使用了以下代码：

dataset.columns.str.replace("[()]", "")

这只会使所有 headers nan

如果有任何帮助，我将不胜感激，非常感谢。

Answer 1

如果 'features' 是系列，您可以尝试：

dataset.columns = features

如果是数据帧，则：

dataset.columns = features['columnName']

或者如果您希望索引值作为列名：

dataset.columns = features.index

creating features for DataFrame from text file in pandas