训练作业的配置文件
Configuration file for training jobs
command ml-engine jobs submit training
accepts a --config
flag that identifies a configuration file for the job. According to the documentation,这个文件的很多字段都是"Output only"。我假设这意味着字段是由 ML 引擎设置的。
如何编写配置文件以便 ML 引擎设置这些 "Output only" 字段?我已经重写了我的文件几次,但是当我 运行 我的应用程序时出现错误。
如果有人有任何示例配置文件,那就太好了。
这是一个如何修改工作人员类型和数量的示例,取自 criteo_tft 示例:
trainingInput:
scaleTier: CUSTOM
masterType: large_model
workerType: complex_model_m
parameterServerType: large_model
workerCount: 60
parameterServerCount: 29
您将找到另一个超参数调整示例,摘自 Census sample。
command ml-engine jobs submit training
accepts a --config
flag that identifies a configuration file for the job. According to the documentation,这个文件的很多字段都是"Output only"。我假设这意味着字段是由 ML 引擎设置的。
如何编写配置文件以便 ML 引擎设置这些 "Output only" 字段?我已经重写了我的文件几次,但是当我 运行 我的应用程序时出现错误。
如果有人有任何示例配置文件,那就太好了。
这是一个如何修改工作人员类型和数量的示例,取自 criteo_tft 示例:
trainingInput:
scaleTier: CUSTOM
masterType: large_model
workerType: complex_model_m
parameterServerType: large_model
workerCount: 60
parameterServerCount: 29
您将找到另一个超参数调整示例,摘自 Census sample。