使用Python将PDF转换成图片

Posted herosunly

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Python将PDF转换成图片相关的知识,希望对你有一定的参考价值。

文章目录

1. 在Windows环境下搭建环境

1.1 安装Python库

  需要安装的库是pdf2image,可通过命令进行安装:

pip install pdf2image

  需要注意的是,如果下载速度过慢,如产生异常信息为:pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host=‘files pythonhosted.org’, port=443): Read timed out。此时的解决方案为更换Python下载源,使用命令为:

python -m pip install --upgrade pip
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

  更换Python下载源的参考链接为:https://mirrors.tuna.tsinghua.edu.cn/help/pypi/

1.2 下载dll依赖库

  dll依赖库为poppler,下载地址为:https://download.csdn.net/download/herosunly/85088822

1.3 将dll依赖库添加到环境变量PATH中

1.3.1 通过GUI(界面)进行永久性添加

  对我的电脑点击鼠标右键,再点击属性,然后选择

  修改admin的用户变量或者系统变量中的Path,其中后者的作用域更大。

  点击编辑后,建议通过界面添加路径,如果是老版本的Windows系统,添加路径的方式是复制原路径,然后添加一个英文的分号,最后再加上添加的路径即可。

1.3.2 通过代码进行临时添加

  这里以Jupyter Notebook为例,需要注意的是下文中的路径需要进行修改成自己环境下的对应路径:

%env path=D:\\software\\poppler-0.68.0_x86\\poppler-0.68.0\\bin
!path

  也可以在cmd中进行添加,读者可自行进行研究,这里不进行赘述。

2. 实操代码

from pdf2image import convert_from_path
pages = convert_from_path('file.pdf')

for ind, page in enumerate(pages):
    page.save('gen_.jpg'.format(ind), 'JPEG')

3. Linux环境进行操作

  Linux环境下与上述类似,唯一的区别在于依赖库可直接通过命令安装poppler-utils,例如最常用的centos的安装命令为:

yum install poppler-utils
《新程序员》:云原生和全面数字化实践 50位技术专家共同创作,文字、视频、音频交互阅读

以上是关于使用Python将PDF转换成图片的主要内容,如果未能解决你的问题,请参考以下文章

python 将文件夹内的图片转换成PDF

PyMuPDF和pdf2imagePython将PDF转成图片

PyMuPDF和pdf2imagePython将PDF转成图片

可以免费PDF转图片的软件?

用PDF编辑器将图片转换成PDF文件的诀窍

办公自动化:Image图片转换成PDF文档存储