CART算法使用的离散化方法是什么?

What is the discretization method that the CART algorithm uses?

我目前正在从事一个 scikit-learn 项目,我想知道分类器使用的决策树算法是如何工作的。我试图了解如何选择树节点上的测试,但我找不到关于该算法用于离散化连续变量的方法的任何解释。我在一篇论文中读到一些决策树算法使用 Tschuprow 的 T 方法,但我不确定 CART 是否正在使用它。 有人知道吗?

我不太确定,但我会说 CART 根据数据评估某个连续变量的所有可能拆分。也就是说,如果我们有 X = {1, 3, 17, 24, 10005},分割点将是 X < 1X >= 1X >= 3X >= 17 等等。

这是在每个节点选择最佳分割的唯一方法,尽管它可能在计算上很昂贵。如果我们只探索所有可能分割的一个子集,我们最终可能会选择一个非最优的(在贪婪的意义上)。