哪些分类器处理 scikit 中的缺失值学习 0.16.1

Which classifiers handle missing values in scikit learn 0.16.1

我有缺失值的数据,我想为它构建一个分类器。我知道 scikit-learn 会帮助您估算缺失数据的值。但是,就我而言,尚不清楚这是正确的做法,甚至还不清楚。问题是数据中的特征是相关的,所以现在以一种合理的方式进行这种插补并不明显。

我知道在 R 中,一些分类器(决策树、随机森林)可以直接处理缺失值,而无需进行任何插补。

scikit learn 0.16.1 中的任何分类器都可以这样做吗?如果可以,我应该如何表示缺失值来帮助它?

我在 scikit learn github 上阅读了有关此主题的讨论,但我无法弄清楚哪些已实际实施,哪些尚未实施。

scikit-learn 中的随机森林目前不处理缺失值 [从 0.16 开始和即将到来的 0.17],您确实需要在之前估算这些值。