AWS之搭建深度学习主机

Posted AYE89

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AWS之搭建深度学习主机相关的知识,希望对你有一定的参考价值。

B.G

至2017.11

GPU选型:(参考知乎、CSDN)

高性价比的两款:GTX1080ti, Titan X

--通常调试算法  i7CPU+32G内存+SSD+2*GPU(单块显存>6G),总计成本2.7 - 4w+RMB

土豪系列:Tesla K80, M40

 

云:(每小时成本高于物理机,优势是托管环境系统)

AWS、UClound

阿里云HPC

 

一、准备工作

 Amazon账号   在AWS上配置深度学习主机

 

AWS 命令行界面 (CLI)    https://aws.amazon.com/cn/cli/

-使用命令行调用 AWS 服务

-可以在命令行上获得帮助,以查看支持的服务。

 

SSH    (PuTTY+文件导入/导出Linux实例)      https://docs.aws.amazon.com/zh_cn/AWSEC2/latest/UserGuide/putty.html?icmpid=docs_ec2_console

 

#划分一个VPC  http://blog.csdn.net/dongdong9223/article/details/47153421

#申请弹性IP EIP  亚马逊EC2 绑定Elastic IP(固定ip)_百度经验

 

二、开启一个实例

以EC2 p2 xlarge为例

0. 创建一个新EC2

共以下几个步骤

1/选择AMI    Deep Learning AMI (官方,包含Keras2.0)

-AMI是一个OS的镜像

-software还需补充 Jupyter Notebook等

2-7 一路进行下去

-“添加存储”按照EBS使用量每月计费,按需申请

配置密钥对

如果你有自己常用的私钥和公钥,可以从密钥对这里导入,否则你可以生成一个新的密钥,然后下载密钥对。

启动后,安装必要的软件,可创建自己的镜像(AMI)供开启竞价实例的时候调用。

 

三、开启竞价实例

打开 EC2 控制面板,如下:

然后选择左侧栏的竞价请求(如果你点击"启动实例"的蓝色按钮,你将进行正常的实例开启进去之后选择操作系统,然后一路进行下去就行,过程中需要创建并下载秘钥对),进去之后,点击"请求竞价实例"的蓝色按钮。然后开始填写,其中AMI选择你想要的(选择Windows系统时一定要带有桌面!),其他按如下填写就行:

然后进入下一页,EBS 卷大小选大一点,比如500G,如果你选的 Windows 系统那就是 C 盘的大小。你也可以再添加其他卷(盘)。接下来 "密钥对名称" 那一栏,没有的话就创建一下,然后下载保存好,后面会用到。"安全组" 一栏可以 default 或者创建一个。 "有效时间" 自己决定就好,反正中途可以自行结束。然后点击审核按钮,然后点击启动。然后你会看到如下页面:

看到状态激活后,点击红框框里的东西,然后你会看到如下页面(刚开始会进行2轮状态检查,全部通过后就是下面这张图):

一旦状态检查通过后,便开始计费了(不足一小时按一小时计费)。下面就可以进行远程桌面连接了。

Note: 竞价实例虽然便宜,但是一旦开启后不能停止,只能终止,一旦终止所有的在远程系统上的配置、数据都将清空,你只能重新开启一次竞价请求。在开启实例之前,如果你有无法从网上直接下载的数据,那么一定要在开启实例之前把所有数据传到网上(如 Google drive 或者 Dropbox 或者百度盘),然后在服务器上下载这些数据,以节省开支。

3. 远程桌面连接

点击上面那张图里的 "连接" 按钮,然后下载远程桌面连接程序,顺便获取一下登陆密码,这时就需要用到之前下载的秘钥对。运行远程桌面连接程序,选择Administrator,然后输入密码。连接成功后,你就可以远程控制服务器了(桌面上的 Chrome,NV 和 Pycharm 都是我后装的):

 

以上是关于AWS之搭建深度学习主机的主要内容,如果未能解决你的问题,请参考以下文章

为什么自建深度学习机器?因为比AWS便宜10倍啊!

[人工智能-深度学习-38]:环境搭建 - 训练主机硬件选择全指南(CPU/GPU/内存/硬盘/电源)

深度学习主机攒机小记

AWS发布深度学习框架MXNet 1.0.0版本,新功能将简化深度学习训练

人工智能之深度学习-初始环境搭建(安装Anaconda3和TensorFlow2步骤详解)

如何在AWS运行Jupyter Notebook