如何使用 weka 删除冗余功能

How to remove redundant features using weka

我有大约 300 个特征,我想通过使用 weka 中的特征选择技术找到最好的特征子集。有人可以告诉我使用什么方法来删除 weka 中的冗余功能:)

您可以使用 Weka 主要使用两种类型的特征选择技术:

  • 使用包装器方法进行特征选择:

“包装器方法将一组特征的选择视为搜索问题,其中准备、评估不同组合并与其他组合进行比较。我们使用预测模型来评估特征组合并根据分数分配分数关于模型准确性。

搜索过程可能是有条不紊的,例如最佳优先搜索,也可能是随机的,例如随机爬山算法,或者可能使用启发式方法,例如前向和后向传递来添加和删除特征。

包装器方法是递归特征消除算法的示例。”[来自http://machinelearningmastery.com/an-introduction-to-feature-selection/]

  • 使用过滤方法进行特征选择:

”过滤特征选择方法应用统计测量为每个特征分配分数。特征按分数排序,并选择保留或从数据集中删除。这些方法通常是单变量的,并考虑特征独立地,或关于因变量。

一些过滤方法的示例包括卡方检验、信息增益和相关系数得分。”[来自 http://machinelearningmastery.com/an-introduction-to-feature-selection/]

如果你使用的是Weka GUI,那么你可以看看我的两个视频投射here and here