从 KNN 算法的数据框列中提取一些特征
extracting some features from a dataframe column for KNN algorithm
我的问题是关于从数据框列中选择和提取一些特征。这会影响 ML 算法的有效性吗?
例如,我正在对 "Chicago crime Dataset" 进行分析。它有一个 "Date Of Occurrence" 列,并且具有以下形式的数据:“2018-11-23 05:10:00”。我想做的是,我想为此添加一些额外的列 "year"、"month"、"weekday"、"hour".
这会影响 KNN 分类器算法的效率吗?
如果您想检查我说的是哪个数据集,这是 link 数据集。
"https://data.cityofchicago.org/Public-Safety/Crimes-2001-to-present/ijzp-q8t2"
添加新特征总是有利于模型学习。始终建议为日期列添加单独的新日期功能。
day
month
day_of_week
year
is_it_weekend
hour
minute
AM_PM
season
我的问题是关于从数据框列中选择和提取一些特征。这会影响 ML 算法的有效性吗? 例如,我正在对 "Chicago crime Dataset" 进行分析。它有一个 "Date Of Occurrence" 列,并且具有以下形式的数据:“2018-11-23 05:10:00”。我想做的是,我想为此添加一些额外的列 "year"、"month"、"weekday"、"hour".
这会影响 KNN 分类器算法的效率吗?
如果您想检查我说的是哪个数据集,这是 link 数据集。
"https://data.cityofchicago.org/Public-Safety/Crimes-2001-to-present/ijzp-q8t2"
添加新特征总是有利于模型学习。始终建议为日期列添加单独的新日期功能。
day
month
day_of_week
year
is_it_weekend
hour
minute
AM_PM
season