在sklearn RandomForestClassifier中,class_weight=None是否等同于class_weight="balanced_subsample"?
In the sklearn RandomForestClassifier, is class_weight=None equivalent to class_weight="balanced_subsample"?
documentation 中的措辞使 None 和 "balanced_subsample" 看起来是等价的,但我想确保情况确实如此。
文档清楚地表明它们 不 等效:
class_weight=None
- 所有 class 的权重都应该是 1
class_weight='balanced_subsample'
- “平衡”模式使用 y 的值自动调整与输入数据中的 class 频率成反比的权重,如 n_samples / (n_classes * np.bincount(y))
.
“balanced_subsample”模式与“平衡”模式相同,只是权重是根据每棵生长的树的 bootstrap 样本计算的。
documentation 中的措辞使 None 和 "balanced_subsample" 看起来是等价的,但我想确保情况确实如此。
文档清楚地表明它们 不 等效:
class_weight=None
- 所有 class 的权重都应该是 1
class_weight='balanced_subsample'
- “平衡”模式使用 y 的值自动调整与输入数据中的 class 频率成反比的权重,如 n_samples / (n_classes * np.bincount(y))
.
“balanced_subsample”模式与“平衡”模式相同,只是权重是根据每棵生长的树的 bootstrap 样本计算的。