Tensorflow Domain Adaptation 如何同时使用两个 Bazel 命令?
Tensorflow Domain Adaptation How can i use two Bazel commands at the same time?
我正在用 tensorflow 训练神经网络。为此,我使用 bazel 运行 命令从 https://github.com/tensorflow/models/tree/master/research/domain_adaptation 中 运行 使用 PixelDA 模型。
bazel run domain_adaptation/pixel_domain_adaptation:pixelda_train -- --dataset_dir $DSN_DATA_DIR --source_dataset mnist --target_dataset mnist_m
bazel run domain_adaptation/pixel_domain_adaptation:pixelda_eval -- --dataset_dir $DSN_DATA_DIR --source_dataset mnist --target_dataset mnist_m --target_split_name test
但我可以训练模型或进行评估。两者不能同时。即使我在另一台计算机上通过 ssh 执行这两个过程(所以我排除了 GPU 问题)
当我有一个 运行ning 训练过程,然后开始评估过程时,训练终止并显示此错误消息
Server terminated abruptly error code: 14, error message: '', log file: '/home/.../.cache/bazel/_bazel_.../c96d77bc006e939d39d6eba4227a082c/server/jvm.out'
如何同时训练和评估?
我尝试删除日志文件,并尝试启动 python 脚本而不使用像 python domain_adaptation/pixel_domain_adaptation/pixelda_train.py -- --dataset_dir $DSN_DATA_DIR --source_dataset mnist --target_dataset mnist_m
这样的 bazel。但是随后发生了奇怪的ImportError: No module named research.domain_adaptation.pixel_domain_adaptation
。如果我删除 "research" 也会发生同样的情况。
- echo $PYTHONPATH 是
:/home/.../models/research:/home/.../models/research/slim
- 结构是
~/models/research/slim/...
并且
~/models/research/domain_adaptation/pixel_domain_adaptation/...
- bazel 版本 0.11.1
- GPU 2x Geforce GTX 1060 (2x6GB),32GB RAM
- 张量流 1.4.1
使用此脚本代替 bazel run
。
https://github.com/bazelbuild/bazel/blob/master/scripts/bazel-run.sh
此脚本在执行 运行 目标之前释放锁。
我正在用 tensorflow 训练神经网络。为此,我使用 bazel 运行 命令从 https://github.com/tensorflow/models/tree/master/research/domain_adaptation 中 运行 使用 PixelDA 模型。
bazel run domain_adaptation/pixel_domain_adaptation:pixelda_train -- --dataset_dir $DSN_DATA_DIR --source_dataset mnist --target_dataset mnist_m
bazel run domain_adaptation/pixel_domain_adaptation:pixelda_eval -- --dataset_dir $DSN_DATA_DIR --source_dataset mnist --target_dataset mnist_m --target_split_name test
但我可以训练模型或进行评估。两者不能同时。即使我在另一台计算机上通过 ssh 执行这两个过程(所以我排除了 GPU 问题)
当我有一个 运行ning 训练过程,然后开始评估过程时,训练终止并显示此错误消息
Server terminated abruptly error code: 14, error message: '', log file: '/home/.../.cache/bazel/_bazel_.../c96d77bc006e939d39d6eba4227a082c/server/jvm.out'
如何同时训练和评估?
我尝试删除日志文件,并尝试启动 python 脚本而不使用像 python domain_adaptation/pixel_domain_adaptation/pixelda_train.py -- --dataset_dir $DSN_DATA_DIR --source_dataset mnist --target_dataset mnist_m
这样的 bazel。但是随后发生了奇怪的ImportError: No module named research.domain_adaptation.pixel_domain_adaptation
。如果我删除 "research" 也会发生同样的情况。
- echo $PYTHONPATH 是
:/home/.../models/research:/home/.../models/research/slim
- 结构是
~/models/research/slim/...
并且~/models/research/domain_adaptation/pixel_domain_adaptation/...
- bazel 版本 0.11.1
- GPU 2x Geforce GTX 1060 (2x6GB),32GB RAM
- 张量流 1.4.1
使用此脚本代替 bazel run
。
https://github.com/bazelbuild/bazel/blob/master/scripts/bazel-run.sh
此脚本在执行 运行 目标之前释放锁。