Pandas高级数据分析快速入门之工具使用——Jupyter导出PDF问题

Posted 肖永威

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas高级数据分析快速入门之工具使用——Jupyter导出PDF问题相关的知识,希望对你有一定的参考价值。

Jupyter Notebooks提供导出多种文件格式的功能,其中,导出PDF比较重要,如下图所示菜单:“文件->下载->PDF via Latex(.pdf)”。

首次执行(Windows 10环境),出现如下错误。

500 : Internal Server Error
错误:
nbconvert failed: xelatex not found on PATH, if you have not installed xelatex you may need to do so. Find further instructions at https://nbconvert.readthedocs.io/en/latest/install.html#installing-tex.

报错原因:没有安装xelatex

(注意:有些情况下,除过要安装"xelatex"外,还需要安装“pandoc", 不过Anaconda2-5.0.1以上版本已经默认安装了pandoc,这时就只需要安装"xelatex")

安装Tex

为了将笔记本文档转换为PDF(带–to PDF),nbconvert使用LaTeX和XeTeX作为渲染引擎。

手动安装一个完整的TeX环境(包括Xeletex和必要的支持软件包)可能很棘手。幸运的是,有一些软件包使这变得更容易。这些软件包特定于不同的操作系统:

  • Linux:texlive
    例如,在Debian或Ubuntu上:
    sudo apt get安装texlive xetexlive字体推荐texlive普通字体
  • macOS(OSX):MacTeX。
  • 视窗:MikTex

由于nbconvert依赖于标准TeX发行版中包含的软件包和字体,如果您没有完整的安装,您可能无法使用nbconvert的标准工具将笔记本转换为PDF

MikTex官方下载,https://miktex.org/download
windows-x64/basic-miktex-21.6-x64.exe

下载并执行basic-miktex-21.6-x64.exe,如下图所示,按提示执行安装即可。

安装后,系统路径如下图所示。

当使用转换PDF功能“文件->下载->PDF via Latex(.pdf)”时,将出现如下所示提示框,点击“安装”即可。注意:将会出现约10多个“宏包安装”,都直接安装即可。


至此,可以实现下载转换不带中文的笔记文档。

安装pandoc

如果笔记文档中有中文,则将继续报错,报错内容如下:

500 : Internal Server Error
错误:
nbconvert failed: Pandoc wasn’t found.
Please check that pandoc is installed:
http://pandoc.org/installing.html

需要继续安装pandoc,pandoc官方下载http://pandoc.org/installing.html。
pandoc-2.14.2-windows-x86_64.msi

按默认要求,执行安装pandoc-2.14.2-windows-x86_64.msi。

至此,可以下载带有中文的文件文档,但是,PDF中,中文不显示。

其他安装包

另外,试验了几个python第三方工具包:
pip install latexify-py
pip install jupyter-cjk-xelatex

对中文没有影响,仍然不显示。

网上有手动修改文件,再转换的方法。

以上是关于Pandas高级数据分析快速入门之工具使用——Jupyter导出PDF问题的主要内容,如果未能解决你的问题,请参考以下文章

Pandas高级数据分析快速入门之五——机器学习特征工程篇

Pandas高级数据分析快速入门之二——基础篇

Pandas高级数据分析快速入门之四——数据可视化篇

Pandas高级数据分析快速入门之六——机器学习预测分析篇

Pandas高级数据分析快速入门之三——数据挖掘与统计分析篇

Pandas高级数据分析快速入门之一——Python开发环境篇