是否有受支持的方法来获取 H2O 模型在训练期间使用的功能列表?
Is there a supported way to get list of features used by a H2O model during its training?
这是我的情况。我有 400 多个功能,其中许多可能没有用,而且通常为零。我希望能够:
- 使用这些特征的子集训练模型
- 查询该模型以获取实际用于构建该模型的特征
- 构建一个仅包含这些特征的 H2OFrame(我为我要预测的每一行得到一个非零值的稀疏列表。)
- 将这个新构建的框架传递给H2OModel.predict() 以获得预测
我很确定找到的内容不受支持但目前有效 (v 3.13.0.341)。还有更多 robust/supported 的方法吗?
model._model_json['output']['names']
响应变量似乎是此列表中的最后一项。
以类似的方式,最好有一种支持的方法来找出模型是在哪个 H2O 版本 下构建的。我在 json.
中找不到版本号
建好模型后想知道模型使用了哪些特征列可以在python中进行如下操作:
my_training_frame = your_model.actual_params['training_frame']
这将 return 一些帧 ID
然后你可以
col_used = h2o.get_frame(my_training_frame)
col_used
已编辑(发表评论后)
获取列使用:
enter code here
col_used.columns
检查已保存二进制模型版本的一种快速方法是尝试将其加载到 h2o 中,如果它加载的是与 h2o 相同的版本,否则您将收到警告。
您也可以打开保存的模型文件,第一行会列出创建它所用的H2O版本。
对于保存为 mojo 的模型,您可以查看 model.ini
文件,它会列出 H2O 的版本
这是我的情况。我有 400 多个功能,其中许多可能没有用,而且通常为零。我希望能够:
- 使用这些特征的子集训练模型
- 查询该模型以获取实际用于构建该模型的特征
- 构建一个仅包含这些特征的 H2OFrame(我为我要预测的每一行得到一个非零值的稀疏列表。)
- 将这个新构建的框架传递给H2OModel.predict() 以获得预测
我很确定找到的内容不受支持但目前有效 (v 3.13.0.341)。还有更多 robust/supported 的方法吗?
model._model_json['output']['names']
响应变量似乎是此列表中的最后一项。
以类似的方式,最好有一种支持的方法来找出模型是在哪个 H2O 版本 下构建的。我在 json.
中找不到版本号建好模型后想知道模型使用了哪些特征列可以在python中进行如下操作:
my_training_frame = your_model.actual_params['training_frame']
这将 return 一些帧 ID
然后你可以
col_used = h2o.get_frame(my_training_frame)
col_used
已编辑(发表评论后)
获取列使用:
enter code here
col_used.columns
检查已保存二进制模型版本的一种快速方法是尝试将其加载到 h2o 中,如果它加载的是与 h2o 相同的版本,否则您将收到警告。
您也可以打开保存的模型文件,第一行会列出创建它所用的H2O版本。
对于保存为 mojo 的模型,您可以查看 model.ini
文件,它会列出 H2O 的版本