Docker: 使用jupyter notebook基础镜像搭建自己的 pytorch 开发环境

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Docker: 使用jupyter notebook基础镜像搭建自己的 pytorch 开发环境相关的知识,希望对你有一定的参考价值。

参考技术A 启动最基本的jupyter notebook镜像:

使用基础镜像 jupyter/datascience-notebook ,因为它预装了常用的模块:pandas, matplotlib, scipy, seaborn, scikit-learn, scikit-image, sympy, cython, patsy, statsmodel, cloudpickle, dill, numba, bokeh;

dockerrun-it--rm -p 8888:8888 jupyter/datascience-notebook:281505737f8a

1

其中 

docker run是使用一个镜像生成一个运行的容器;

-it指交互模式,启动后终端在运行着的容器里面,与之对应的有-d后端运行模式,启动后终端交互在实体机,要想进入容器需要使用命令docker exec -it container-name bash docker exec -it container-name意为交互模式进入正在运行的一个容器,bash意为进入容器后使用的命令,这里用的是bash,这样进入容器后就能执行shell;

--rm意为退出shell的时候自动删除容器,常在测试的时候使用,这样不用每次修改去删除已有的容器;

-p 8888:8888指的是端口映射,前面的是实体机的端口,后面是容器里面暴露出的端口,两边端口可以不一样,这样同一个镜像可以启动多个对应不同端口的服务;

jupyter/datascience-notebook:281505737f8a是镜像名字,冒号后面的是tag,类似于版本的概念,如果不显式的给出tag每次都回从hub上拉取latest的镜像,如果网络环境不好的话比较费时间,推荐显式给出tag,这样每次构建都会使用已有的镜像。

启动后就可以在终端看到:

[I 04:01:05.691 NotebookApp] Running the core application with no additional extensions or settings

[I 04:01:05.692 NotebookApp] Serving notebooks from local directory: /home/jovyan

[I 04:01:05.692 NotebookApp] 0 active kernels

[I 04:01:05.692 NotebookApp] The Jupyter Notebook is running at:

[I 04:01:05.692 NotebookApp] http://[all ip addresses on your system]:8888/?token=0a3331628e0e35f94eb0ad543faeb3e396fbccfa3ff06e5a

[I 04:01:05.692 NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation).

[C 04:01:05.692 NotebookApp]

    Copy/paste this URL into your browser when you connect for the first time,

    to login with a token:

        http://localhost:8888/?token=0a3331628e0e35f94eb0ad543faeb3e396fbccfa3ff06e5a

此时是停在容器里面,打开浏览器 访问http://localhost:8888/?token=0a3331628e0e35f94eb0ad543faeb3e396fbccfa3ff06e5a 即可打开基本的jupyter notebook 环境,后面的token是随机生成的;

启动带权限的容器

生成自定义token

# Python脚本生成密码i

# Python脚本生成密码

import IPython

IPython.lib.passwd()

输入密码生成token

test的token:sha1:6587feaef3b1:6b243404e4cfaafe611fdf494ee71fdaa8c4a563

自定义token运行容器:

docker run -d -p 8888:8888 jupyter/datascience-notebook start-notebook.sh --NotebookApp.password='sha1:6587feaef3b1:6b243404e4cfaafe611fdf494ee71fdaa8c4a563'

这时访问http://localhost:8888/会出现输入密码的页面,输入正确的密码才能进入jupyter。

共享目录

-v参数

docker提供-v参数使实体机和容器共享目录,这对于有状态的服务很有用,目录挂载添加参数: 

-v /home/jason/jason/docker/notebook:/home/jovyan/work

运行带有目录共享的容器

docker run-it--rm-p8888:8888-v/home/jason/jason/docker/notebook:/home/jovyan/work  jupyter/datascience-notebookstart-notebook.sh--NotebookApp.password='sha1:6587feaef3b1:6b243404e4cfaafe611fdf494ee71fdaa8c4a563'

这样在jupyter里新建的notebook都会出现在实体机指定的目录里。由于这个镜像的原因 需在work目录下新建才能在实体机看到。

基于jupyter/datascience-notebook 生成pytorch image

Dockerfile

因为没有合适的pytorch镜像,自己编辑Dockerfile:

新建文件Dockerfile并编辑内容:

FROM jupyter/datascience-notebook:281505737f8a

MAINTAINER Jason.W. "jianchengss@163.com"

# 下面是按官网的方法安装spotlight

#RUN pip --no-cache-dir install --upgrade install http://download.pytorch.org/whl/cu75/torch-0.2.0.post3-cp36-cp36m-manylinux1_x86_64.whl

#RUN pip --no-cache-dir install --upgrade torchvision

# pytorch

RUN conda install pytorch torchvision -c soumith

# spotlight(https://github.com/maciejkula/spotlight)

RUN conda install -c maciejkula -c soumith spotlight=0.1.2

build

在Dockerfile目录里运行命令:docker build -t jianchengss/datascience-pytorch:0.1 . 

这样就生成了image:jianchengss/datascience-pytorch:0.1可以运行docker images查看本机上所有的image。

从构建的镜像运行容器

docker run-it--rm-p8888:8888-v~/workspace/python/notebooks-pytorch:/home/jovyan/work--privileged=truejianchengss/datascience-pytorch:0.1start-notebook.sh--NotebookApp.password='sha1:6587feaef3b1:6b243404e4cfaafe611fdf494ee71fdaa8c4a563'

最终容器

经过以上步骤,测试完成后既可以执行最终运行的命令 注意 token换成自己的

docker run-d-p8588:8888-v~/workspace/python/notebooks-pytorch:/home/jovyan/work--privileged=true--name=pytorch jianchengss/datascience-pytorch:0.1start-notebook.sh--NotebookApp.password='sha1:7aee2f913c8e:17d40f203cbd5c9820f302894a92724c3de9fba6'

-it --rm 换成了 -d,比之前多的参数有:

--name=pytorch,意为给container取一个名字,好区分和管理,缺省的话名字为一串随机的字符串。

--privileged=true出现文件夹访问权限的时候添加该属性

此时运行docker ps即可查看运行着的容器:

CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES

3bd3e30e9ab3        jianchengss/datascience-pytorch:0.1  "tini -- start-notebo"  4 seconds ago      Up 3 seconds        0.0.0.0:8588->8888/tcp  pytorch

进入容器操作

容器启动后有时候需要进入容器操作,比方说查看信息或者安装新的软件,此时执行docker exec -it pytorch bash

其他命令

docker stop container-name # 停止运行着的容器

docker rm container-name # 删除已有的容器,要先停止

docker rmi image-name # 删除已有的镜像

以上是关于Docker: 使用jupyter notebook基础镜像搭建自己的 pytorch 开发环境的主要内容,如果未能解决你的问题,请参考以下文章

数据清洗之 重复值处理

DataSpell下载安装使用

访问在 Docker 容器上运行的 Jupyter notebook

sh 如何使用jupyter / jupyterhub Docker镜像

Docker 安装jupyter

DataSpell---强大的数据科学 IDE