浏览代码

Update Assignment7.md

merge-requests/9/head
xuesong 4 年前
父节点
当前提交
b1eee55800
共有 1 个文件被更改,包括 33 次插入2 次删除
  1. +33
    -2
      Assignment7.md

+ 33
- 2
Assignment7.md 查看文件

@ -179,21 +179,52 @@ git pull root@gitea.shuishan.net.cn:luxuesong_dase_ecnu_edu_cn/mnist.git //将
在步骤四)和五)中,我们将代码放在code文件夹中,数据放在data中,模型放在output中
### 四)创建UAI Train交互式训练任务,并切换成`编辑模式` (重要!!)
#### 1)在UCloud产品中人工智能分类下面,选择"AI训练服务 UAI Train",点击“交互式训练”选项卡->创建交互式训练任务
#### 2)任务命名随意,在执行信息里面,输入Ucloud账号的公钥和私钥(右上角“API密钥”),代码镜像路径为默认,其余路径均选择UFS,然后如下图所示配置
<kbd>
<img src="img/assignment7/ass7-aitrain.png">
</kbd>
> 简要说明一下交互式训练的工作原理:启动任务的时候,UAI Train会运行一个docker容器,可以是UCloud的默认镜像,也可以是你自己创建的镜像,默认镜像已经安装了python,pytorch,tensorflow等等工具。我们配置的上述UFS路径,UAI Train会将他们映射到容器的/data目录下。也就是说,mnist/data会映射到容器的/data/data目录,mnist/code会映射到容器的/data/code目录。接下来我们便可以在容器中访问这些路径,运行代码。
#### 3)配置完毕,创建任务,等状态变成“执行中”,说明创建成功。
<kbd>
<img src="img/assignment7/ass7-trainjob.png">
</kbd>
#### 4)这一步非常重要!!创建成功后,立即将任务模式从“训练模式”切换成`编辑模式`。
> 点击“切换”
<kbd>
<img src="img/assignment7/ass7-switch1.png">
</kbd>
> 选择一个镜像库,填入要保存的镜像名。如果你的项目中还没有镜像库,则新建一个镜像库。
<kbd>
<img src="img/assignment7/ass7-switch2.png">
</kbd>
> 填入公钥和私钥,点击“确定”
<kbd>
<img src="img/assignment6/ass6-intra.jpeg">
<img src="img/assignment7/ass7-switch3.png">
</kbd>
> 等待几分钟,等运行状态重新变成“执行中”,说明切换成功。这时候任务模式已经是“编辑模式”。
<kbd>
<img src="img/assignment6/ass6-intrassh.jpeg">
<img src="img/assignment7/ass7-switch4.png">
</kbd>
说明:这么做的原因只有一个,训练模式烧钱 :joy: :joy: !!
#### 3)现在让我们把这三个云主机连接到负载均衡器,并且从负载均衡器中删除刚才的具有外网ip的节点(接下来我们要用外网ip节点做压测)。首先我们禁用掉其中的两个节点,只保留一个节点在启用状态。如下图所示。
<kbd>

正在加载...
取消
保存