可以将自定义 sklearn 模型上传到 gcloud ml-engine 吗?

Can a custom sklearn model be uploaded to gcloud ml-engine?

我已经尝试了在 gcloud tutorial 之后将 sklearn 模型部署到 ml-engine 的新功能。我为 sklearn Estimator GaussianMixture 创建了一个包装器,以便更改预测函数,使其输出概率输出(如 sample_scores)而不是默认的 class 预测。

GMMWrapper.py

class GMMWrapper(GaussianMixture):
    def predict(self, X):
        return self.score_samples(X)

我创建管道并以标准方式保存它:

gmm = GMMWrapper()
pipegmm = Pipeline([('gmm', gmm)])
pipegmm.fit(data)
with tf.gfile.Open(model_output_path, 'wb') as model_file:
    joblib.dump(pipegmm, model_output_path + '.joblib')

然而,当使用 gcloud beta ml-engine versions create 部署到 gcloud 时,它当然找不到模块 GMMWrapper

ERROR: (gcloud.beta.ml-engine.versions.create) Bad model detected with
error:  "Failed to load model: Could not load the model: 
/tmp/model/0001/model.joblib. No module named 'GMMWrapper'.

我已尝试将其包含在将上传到临时存储桶的部署源文件夹中。

DEPLOYMENT_SOURCE="/folder-containing-model-and-GMMWrapper"
MODEL_NAME="GMMs"
FRAMEWORK="SCIKIT_LEARN"
STAGING_BUCKET="gs://sklearn-models"

gcloud beta ml-engine versions create v1 \
    --model $MODEL_NAME --origin $DEPLOYMENT_SOURCE \
    --framework $FRAMEWORK --staging-bucket $STAGING_BUCKET \
    --runtime-version=1.5 --python-version=3.5

但是那个returns同样的错误。我需要以某种方式通知 gcloud 在哪里寻找模块。我怀疑这是不可能的,但我想如果有办法我会问。

(或者,如果有一种方法可以在管道上调用 predict 时更改调用哪个函数,这也可以解决我的问题。)

目前不支持此功能。我们一直在寻找改进产品的方法,并将考虑这个建议的功能。