|
@ -179,21 +179,52 @@ git pull root@gitea.shuishan.net.cn:luxuesong_dase_ecnu_edu_cn/mnist.git //将 |
|
|
在步骤四)和五)中,我们将代码放在code文件夹中,数据放在data中,模型放在output中 |
|
|
在步骤四)和五)中,我们将代码放在code文件夹中,数据放在data中,模型放在output中 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
### 四)创建UAI Train交互式训练任务,并切换成`编辑模式` (重要!!) |
|
|
|
|
|
|
|
|
|
|
|
#### 1)在UCloud产品中人工智能分类下面,选择"AI训练服务 UAI Train",点击“交互式训练”选项卡->创建交互式训练任务 |
|
|
|
|
|
|
|
|
|
|
|
#### 2)任务命名随意,在执行信息里面,输入Ucloud账号的公钥和私钥(右上角“API密钥”),代码镜像路径为默认,其余路径均选择UFS,然后如下图所示配置 |
|
|
|
|
|
|
|
|
|
|
|
<kbd> |
|
|
|
|
|
<img src="img/assignment7/ass7-aitrain.png"> |
|
|
|
|
|
</kbd> |
|
|
|
|
|
|
|
|
|
|
|
> 简要说明一下交互式训练的工作原理:启动任务的时候,UAI Train会运行一个docker容器,可以是UCloud的默认镜像,也可以是你自己创建的镜像,默认镜像已经安装了python,pytorch,tensorflow等等工具。我们配置的上述UFS路径,UAI Train会将他们映射到容器的/data目录下。也就是说,mnist/data会映射到容器的/data/data目录,mnist/code会映射到容器的/data/code目录。接下来我们便可以在容器中访问这些路径,运行代码。 |
|
|
|
|
|
|
|
|
|
|
|
#### 3)配置完毕,创建任务,等状态变成“执行中”,说明创建成功。 |
|
|
|
|
|
|
|
|
|
|
|
<kbd> |
|
|
|
|
|
<img src="img/assignment7/ass7-trainjob.png"> |
|
|
|
|
|
</kbd> |
|
|
|
|
|
|
|
|
|
|
|
#### 4)这一步非常重要!!创建成功后,立即将任务模式从“训练模式”切换成`编辑模式`。 |
|
|
|
|
|
|
|
|
|
|
|
> 点击“切换” |
|
|
|
|
|
|
|
|
|
|
|
<kbd> |
|
|
|
|
|
<img src="img/assignment7/ass7-switch1.png"> |
|
|
|
|
|
</kbd> |
|
|
|
|
|
|
|
|
|
|
|
> 选择一个镜像库,填入要保存的镜像名。如果你的项目中还没有镜像库,则新建一个镜像库。 |
|
|
|
|
|
|
|
|
|
|
|
<kbd> |
|
|
|
|
|
<img src="img/assignment7/ass7-switch2.png"> |
|
|
|
|
|
</kbd> |
|
|
|
|
|
|
|
|
|
|
|
> 填入公钥和私钥,点击“确定” |
|
|
|
|
|
|
|
|
<kbd> |
|
|
<kbd> |
|
|
<img src="img/assignment6/ass6-intra.jpeg"> |
|
|
|
|
|
|
|
|
<img src="img/assignment7/ass7-switch3.png"> |
|
|
</kbd> |
|
|
</kbd> |
|
|
|
|
|
|
|
|
|
|
|
> 等待几分钟,等运行状态重新变成“执行中”,说明切换成功。这时候任务模式已经是“编辑模式”。 |
|
|
|
|
|
|
|
|
<kbd> |
|
|
<kbd> |
|
|
<img src="img/assignment6/ass6-intrassh.jpeg"> |
|
|
|
|
|
|
|
|
<img src="img/assignment7/ass7-switch4.png"> |
|
|
</kbd> |
|
|
</kbd> |
|
|
|
|
|
|
|
|
|
|
|
说明:这么做的原因只有一个,训练模式烧钱 :joy: :joy: !! |
|
|
|
|
|
|
|
|
#### 3)现在让我们把这三个云主机连接到负载均衡器,并且从负载均衡器中删除刚才的具有外网ip的节点(接下来我们要用外网ip节点做压测)。首先我们禁用掉其中的两个节点,只保留一个节点在启用状态。如下图所示。 |
|
|
#### 3)现在让我们把这三个云主机连接到负载均衡器,并且从负载均衡器中删除刚才的具有外网ip的节点(接下来我们要用外网ip节点做压测)。首先我们禁用掉其中的两个节点,只保留一个节点在启用状态。如下图所示。 |
|
|
|
|
|
|
|
|
<kbd> |
|
|
<kbd> |
|
|