******注意,实验结束请立即删除云主机UHost,负载均衡ULB和容器云UK8S集群,节省费用******
******注意2,实验未结束且短期内不会继续实验,也请删除上述所有资源。下次实验时重新创建******
实验步骤 一)
实验步骤 二)
实验步骤 三)
12月11日
云主机UHost、容器云UK8S、私有网络VPC
云主机UHost、镜像库UHub、负载均衡ULB、容器云UK8S、基础网络UNet
K8S:
请参考https://www.yuque.com/serviceup/cloud-native-talks/k8s-roadmap-primary
curl -LO https://storage.googleapis.com/kubernetes-release/release/$(curl -s https://storage.googleapis.com/kubernetes-release/release/stable.txt)/bin/linux/amd64/kubectl
chmod +x ./kubectl
sudo mv kubectl /usr/local/bin/kubectl
kubectl version
kubectl version
,可以看到输出有变化**************作业1:请将到这一步的kubectl version输出信息页面截图,并插入实验报告***************
kubectl get pods
kubectl get deployments
kubectl get services
NFS(Network File System)是一个能够使得本地主机访问远程主机文件系统的应用程序。因为步骤一)创建的文件存储对于当前的云主机来讲是一个远程存储(网络存储),使用NFS协议才能将其挂载到当前云主机上。
sudo yum mount -t nfs4 你的文件存储IP地址:/ /mnt
df -hT
你应该看到如下图所示内容
**************作业2:请将df -hT的运行后界面截图,并插入实验报告***************
sudo yum install -y git
git config --global user.name "陆雪松"
git config --global user.email "xuesong.lu.dase@gmail.com"
ssh-keygen
不用在提示符中输入任何内容,连摁回车,密钥即生成。可以在~/.ssh/下看到你生成的两个密钥,id_rsa是私钥,id_rsa.pub是公钥。如果你使用root账号,密钥在/root/.ssh/目录下。接下来我们要把公钥给码园,以后从这台云主机访问码园,云主机会把私钥提供给码园进行身份验证。
cat ~/.ssh/id_rsa.pub
复制屏幕上出现的公钥内容
eval 'ssh-agent -s'
exec ssh-agent bash
ssh-add ~/.ssh/id_rsa
ssh -T root@gitea.shuishan.net.cn
如果你看到类似如下输出,说明密钥访问设置成功
cd /mnt
sudo mkdir mnist
sudo chown xuesong:xuesong mnist //更改mnist文件夹拥有者(即你的云主机登录账号)。假如你使用root账号,这步不需要
cd mnist
git init
git pull root@gitea.shuishan.net.cn:luxuesong_dase_ecnu_edu_cn/mnist.git //将pull后面的内容替换成你仓库的ssh地址
在步骤四)和五)中,我们将代码放在code文件夹中,数据放在data中,模型放在output中
**************作业3:请在mnist目录下运行ls -la命令并截图,插入实验报告***************
编辑模式
(重要!!)简要说明一下交互式训练的工作原理:启动任务的时候,UAI Train会运行一个docker容器,可以是UCloud的默认镜像,也可以是你自己创建的镜像,默认镜像已经安装了python,pytorch,tensorflow等等工具。我们配置的上述UFS路径,UAI Train会将他们映射到容器的/data目录下。也就是说,mnist/data会映射到容器的/data/data目录,mnist/code会映射到容器的/data/code目录。接下来我们便可以在容器中访问这些路径,运行代码。
编辑模式
。点击“切换”
选择一个镜像库,填入要保存的镜像名。如果你的项目中还没有镜像库,则新建一个镜像库。
填入公钥和私钥,点击“确定”
等待几分钟,等运行状态重新变成“执行中”,说明切换成功。这时候任务模式已经是“编辑模式”。
说明:这么做的原因只有一个,训练模式跑的是GPU,太烧钱 😂 😂 !! 写代码时是不需要GPU的,所以切换到编辑模式,跑在CPU机器上;当代码完成,需要大规模训练的时候,才使用训练模式。
**************作业4:请将编辑模式页面截图,插入实验报告***************
wget https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
git remote add origin root@gitea.shuishan.net.cn:luxuesong_dase_ecnu_edu_cn/mnist.git //替换成你的码园仓库
git add .
git commit -m "xuesong's first commit"
git push origin master
没有报错则成功push,去水杉码园查看你的仓库验证。
**************作业5:上述代码训练的模型,在测试集上精度较低(如下图),请把测试集上的精度提升到95%以上(即运行model.evaluate(x_test, y_test)后,accurray在95%以上),将运行结果截图并插入实验报告***************
提示:你可以尝试增加epoch,也可以尝试更换优化器,其他优化器有Adagrad, RMSprop, Adam等
git add .
git commit -m "commit source code and model"
git push origin master