TrainJob使用流程

使用流程

使用TrainJob的流程如下,初始化Xiaomi Cloud-ML客户端环境。

cloudml init

然后打包模型代码,上传到FDS中。

mkdir trainer

touch trainer/__init__.py

curl "https://raw.githubusercontent.com/XiaoMi/cloud-ml-sdk/master/cloud_ml_samples/tensorflow/linear_regression/trainer/task.py" > trainer/task.py

cat << EOF > setup.py
import setuptools
setuptools.setup(name='trainer', version='1.0', packages=['trainer'])
EOF

python setup.py sdist --format=gztar

最后使用cloudml命令提交即可。

cloudml jobs submit -n linear -m trainer.task -u fds://cloud-ml/linear/trainer-1.0.tar.gz -a "--model_path fds://cloud-ml/linear_model --output_path fds://cloud-ml/linear_tensorboard"

训练任务启动后,可以直接查看任务提交后的状态和日志等信息。

cloudml jobs events linear

cloudml jobs logs linear

参数介绍

  • -n 是必选参数,用户可以自行选择任务名称。
  • -m 是必选参数,需要和用户打包的Python模块名对应。
  • -u 是必选参数,需要和用户上传到FDS的路径对应。
  • -a 是可选参数,可以在提交任务时传入任意的用户自定义参数。

更多功能

TrainJob还支持GPU训练、超参数自动调优等功能,可继续阅读后面的文档。

results matching ""

    No results matching ""