H2O 建模:独立的 k 均值或回归代码

H2O modelling: stand-alone k-means or regression code

我对 H2O 和 运行 荨麻疹模型还很陌生。我现在考虑 H2O 的原因是我的理解是 H2O 有助于在各种建模过程中优化数据解析(例如 k-means 或逻辑回归)。我的问题是:有没有办法让我在 H2O 中编写 python(或 R)k-means 代码和 运行,或者唯一的方法是使用 H2O 预构建过程?如果是后者,那么我可以提取最终评分代码以便安排自动 运行 进行常规评分吗? 如果第一个选项也是可能的(我注意到选项“导入代码”),那么解析将如何在这个过程中发生(例如,在数据准备、变量标准化、实际的 k-means 评分代码、分配最终段规则)?

谢谢

娜塔莉

您将需要使用 Python 中的 H2OKMeansEstimator 方法(或 R 中的 h2o.kmeans() 函数)——无法 "import" 您自己的 K-表示编码为 H2O,我认为这就是您要问的。有关 H2O 的 K-means 实现的更多信息 here

要导出 H2O K-means 模型以供在生产环境中使用(评分),您可以将模型导出为 POJO or MOJO (pure Java code with no dependencies), or you can save a binary H2O model,这需要在评分时有一个 H2O 集群 运行 -时间。