R中information.gain中公式的使用
Use of formula in information.gain in R
在 FSelector information.gain 函数的函数定义中,
information.gain(公式,数据)
公式的具体用途是什么?我正在尝试使用该函数为 classification 任务进行特征选择。在我在网上看到的几个例子中,公式似乎定义了 class 标签和数据集中特征之间的某种关系。但是,如果是这种情况,我不知道特征和标签之间的确切线性关系,因为我正在执行 class化任务,那么公式是什么?
您可以使用 .
告诉 R 您想要分析 class 变量与数据框中所有其他变量之间的依赖关系。例如对于 iris
数据集:
> library(FSelector)
> information.gain(Species~., iris)
attr_importance
Sepal.Length 0.4521286
Sepal.Width 0.2672750
Petal.Length 0.9402853
Petal.Width 0.9554360
如果您只想分析与变量子集相关的交互作用,您可以使用显式名称:
> information.gain(Species~Sepal.Length+Sepal.Width, iris)
attr_importance
Sepal.Length 0.4521286
Sepal.Width 0.2672750
在 FSelector information.gain 函数的函数定义中,
information.gain(公式,数据)
公式的具体用途是什么?我正在尝试使用该函数为 classification 任务进行特征选择。在我在网上看到的几个例子中,公式似乎定义了 class 标签和数据集中特征之间的某种关系。但是,如果是这种情况,我不知道特征和标签之间的确切线性关系,因为我正在执行 class化任务,那么公式是什么?
您可以使用 .
告诉 R 您想要分析 class 变量与数据框中所有其他变量之间的依赖关系。例如对于 iris
数据集:
> library(FSelector)
> information.gain(Species~., iris)
attr_importance
Sepal.Length 0.4521286
Sepal.Width 0.2672750
Petal.Length 0.9402853
Petal.Width 0.9554360
如果您只想分析与变量子集相关的交互作用,您可以使用显式名称:
> information.gain(Species~Sepal.Length+Sepal.Width, iris)
attr_importance
Sepal.Length 0.4521286
Sepal.Width 0.2672750