什么是递归分区从 n 级数据创建 2^n 组合?
what does recursive partitioning create 2^n combinations from n levels of data?
当 运行 随机森林时,它不允许单个变量超过 32 个级别,因为它会导致 2^n 数据组合/分区。我认为它会遵循 n!/k!(n-k) 的经典组合方程!对于 n 选择 k。谁能解释这是为什么?例如,如果我在一个变量中有 4 个级别,它将划分为 2^4=16,我怀疑它应该是 16/4=4。
我怀疑这是由于构成较大随机森林的决策树内部进行的递归分区所致。
我相信您混淆了两种情况。您正在查看 "How many ways can I choose a given number, k, items from a set of n items?" 实际问题是 "How many ways can I pick a set of items from n items?"
第二个问题是第一个问题的总和,k = 0 到 n。
这个和是 2^n.
查看它的另一种方式是在您选择的集合中是否存在任何给定元素。每个元素有两个选择,我们总共有 2^n 种可能性。
这里有一个例子:让我们以集合 {1, 2, 3, 4} 为例。
情况一:我可以从这个集合中选择多少种方法来选择k=2个元素?
1 2
1 3
1 4
2 3
2 4
3 4
确实是 4 个! / (2!2!) = 6 种可能性
然而,当我们查看所有 k 值的总分区时,我们得到
. . . . (empty set)
4
3
3 4
2
2 4
2 3
2 3 4
1
1 4
1 3
1 3 4
1 2
1 2 4
1 2 3
1 2 3 4
也就是 2^4 = 16 个选项。请注意,这也是不同 k 值的总和:1 + 4 + 6 + 4 + 1
当 运行 随机森林时,它不允许单个变量超过 32 个级别,因为它会导致 2^n 数据组合/分区。我认为它会遵循 n!/k!(n-k) 的经典组合方程!对于 n 选择 k。谁能解释这是为什么?例如,如果我在一个变量中有 4 个级别,它将划分为 2^4=16,我怀疑它应该是 16/4=4。
我怀疑这是由于构成较大随机森林的决策树内部进行的递归分区所致。
我相信您混淆了两种情况。您正在查看 "How many ways can I choose a given number, k, items from a set of n items?" 实际问题是 "How many ways can I pick a set of items from n items?"
第二个问题是第一个问题的总和,k = 0 到 n。 这个和是 2^n.
查看它的另一种方式是在您选择的集合中是否存在任何给定元素。每个元素有两个选择,我们总共有 2^n 种可能性。
这里有一个例子:让我们以集合 {1, 2, 3, 4} 为例。
情况一:我可以从这个集合中选择多少种方法来选择k=2个元素?
1 2
1 3
1 4
2 3
2 4
3 4
确实是 4 个! / (2!2!) = 6 种可能性
然而,当我们查看所有 k 值的总分区时,我们得到
. . . . (empty set)
4
3
3 4
2
2 4
2 3
2 3 4
1
1 4
1 3
1 3 4
1 2
1 2 4
1 2 3
1 2 3 4
也就是 2^4 = 16 个选项。请注意,这也是不同 k 值的总和:1 + 4 + 6 + 4 + 1