如何码头化 Jupyter 实验室
Posted
技术标签:
【中文标题】如何码头化 Jupyter 实验室【英文标题】:How to dockerize Jupyter lab 【发布时间】:2018-08-08 00:59:50 【问题描述】:我正在尝试对 Jupyter Lab 进行 docker 化,因此我尝试如下创建一个 Dockerfile
,
FROM python:3.6
WORKDIR /jup
RUN pip install jupyter -U && pip install jupyterlab
EXPOSE 8888
ENTRYPOINT ["jupyter", "lab"]
并运行命令,docker build . -t jupyter
然后docker run jupyter
。但不幸的是,我遇到了一些错误,如下所示
[I 07:56:34.123 LabApp] Writing notebook server cookie secret to /root/.local/share/jupyter/runtime/notebook_cookie_secret
Traceback (most recent call last):
File "/usr/local/bin/jupyter-lab", line 11, in <module>
sys.exit(main())
File "/usr/local/lib/python3.6/site-packages/jupyter_core/application.py", line 266, in launch_instance
return super(JupyterApp, cls).launch_instance(argv=argv, **kwargs)
File "/usr/local/lib/python3.6/site-packages/traitlets/config/application.py", line 657, in launch_instance
app.initialize(argv)
File "<decorator-gen-7>", line 2, in initialize
File "/usr/local/lib/python3.6/site-packages/traitlets/config/application.py", line 87, in catch_config_error
return method(app, *args, **kwargs)
File "/usr/local/lib/python3.6/site-packages/notebook/notebookapp.py", line 1507, in initialize
self.init_webapp()
File "/usr/local/lib/python3.6/site-packages/notebook/notebookapp.py", line 1297, in init_webapp
self.http_server.listen(port, self.ip)
File "/usr/local/lib/python3.6/site-packages/tornado/tcpserver.py", line 142, in listen
sockets = bind_sockets(port, address=address)
File "/usr/local/lib/python3.6/site-packages/tornado/netutil.py", line 197, in bind_sockets
sock.bind(sockaddr)
OSError: [Errno 99] Cannot assign requested address
我怎样才能 dockerize jupyter lab
? [通过解决这个错误]
【问题讨论】:
【参考方案1】:当你启动jupyter lab
时,你应该定义--ip
参数。例如,--ip=0.0.0.0
。
在这之后你会遇到另一个错误:
[C 08:14:56.973 LabApp] Running as root is not recommended. Use --allow-root to bypass.
所以,如果你想继续,你还需要添加--allow-root
。
最后的Dockerfile
是:
FROM python:3.6
WORKDIR /jup
RUN pip install jupyter -U && pip install jupyterlab
EXPOSE 8888
ENTRYPOINT ["jupyter", "lab","--ip=0.0.0.0","--allow-root"]
【讨论】:
说你现在有这个容器在服务器上运行,你如何从另一台计算机访问这个 Jupyter Lab? 当我将实例的公共 IP 作为 IP 地址在--ip=
中时,我收到错误 OSError: [Errno 99] Cannot assign requested address
【参考方案2】:
在搜索时我遇到了这个问题,然后在 Jupyter Docker Stacks 的“阅读文档”页面中发现了对 Jupyter Labs 的引用(请参阅here)。文档说:
JupyterLab 已作为笔记本扩展预安装,从标签 c33a7dc0eece 开始。
他们建议使用如下命令:
docker run -it --rm -p 8888:8888 jupyter/datascience-notebook start.sh jupyter lab
我想我不妨在这里添加参考,以防它对其他人有用。 (例如,在 Docker Hub 上并不是很明显支持 Jupyter Labs。)
【讨论】:
【参考方案3】:作为使用 JupyterLab 构建自己的 Docker 映像的替代方法,您还可以使用 ML Workspace 映像。 ML Workspace 是一个开源 Web IDE,它将 Jupyter、JupyterLab、VS Code 和许多其他工具和库组合到一个方便的 Docker 映像中。部署单个工作区实例非常简单:
docker run -p 8080:8080 mltooling/ml-workspace:latest
所有工具都可以从同一个端口访问并集成到 Jupyter UI 中。您可以找到有关如何访问 JupyterLab here 的更多信息。
【讨论】:
【参考方案4】:您真的不必自己动手。 Jupyter Docker Stack 提供现成的 JupyterLab 镜像,可与 JupyterHub docker 镜像一起使用。 Hub 可以为每个运行给定 JupyterLab 的用户“生成”一个单独的容器(搜索负责魔术的 DockerSpawner
类)。
我将其添加为单独答案的原因是 CAVEAT:虽然 useful links 可在 Internet 上找到,但它们通常已过时,并且文档与现实之间存在不一致,导致“Jupyter 的生产性 Dockerisation”相当痛苦。仅举几例我遇到的:
-
如果您在 Docker 主机上没有 root 权限,那么将临时用户添加到 Hub 容器会相当复杂。我需要这个,因为我正在教授课程,参与者必须获得在课程结束后被删除的临时帐户,并且不允许我使用这些帐户污染 Docker 主机。
对于登录 JupyterHub 的用户身份存在很多混淆vs在 JupyterLab 中实际运行的用户身份 容器:后者始终为
jovyan
,UID=1000。这可能会导致有关文件所有权和权限的意外意外。
如果将示例脚本和数据集“添加”到实验室容器中,以便每个课程参与者都能获得一组标准化的文件以开始使用,那么您将需要 startup hooks 进行复制操作,并满足一些有趣的要求.例如。复制脚本不得具有.sh
扩展名,因为那样它就意味着做一些不同的事情......
当然是 YMMV。尽管如此,当它工作时,它是一个相当优雅的设置。我很快就会在一些不幸的学生身上真正尝试一下:-)
【讨论】:
以上是关于如何码头化 Jupyter 实验室的主要内容,如果未能解决你的问题,请参考以下文章