从 pandas 中的文本文件为 DataFrame 创建特征
creating features for DataFrame from text file in pandas
我希望使用 feature_names.txt 使用以下代码为数据框创建特征:
import pandas as pd
features = pd.read_csv("feature_names.txt", header= None)
dataset = pd.read_csv("dataset.csv")
dataset.columns = features.values
这会输出以下内容:
(id ,) (年龄,) (工种,) (fnlwgt,) (教育,) (education-num,) (marital-status,) (职业,) (关系,)
我想删除括号和逗号,但使用了以下代码:
dataset.columns.str.replace("[()]", "")
这只会使所有 headers nan
如果有任何帮助,我将不胜感激,
非常感谢。
如果 'features' 是系列,您可以尝试:
dataset.columns = features
如果是数据帧,则:
dataset.columns = features['columnName']
或者如果您希望索引值作为列名:
dataset.columns = features.index
我希望使用 feature_names.txt 使用以下代码为数据框创建特征:
import pandas as pd
features = pd.read_csv("feature_names.txt", header= None)
dataset = pd.read_csv("dataset.csv")
dataset.columns = features.values
这会输出以下内容:
(id ,) (年龄,) (工种,) (fnlwgt,) (教育,) (education-num,) (marital-status,) (职业,) (关系,)
我想删除括号和逗号,但使用了以下代码:
dataset.columns.str.replace("[()]", "")
这只会使所有 headers nan
如果有任何帮助,我将不胜感激, 非常感谢。
如果 'features' 是系列,您可以尝试:
dataset.columns = features
如果是数据帧,则:
dataset.columns = features['columnName']
或者如果您希望索引值作为列名:
dataset.columns = features.index