Python应用PDF处理-pypdf2

Posted 既生喻何生亮(Bright)

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python应用PDF处理-pypdf2相关的知识,希望对你有一定的参考价值。

概述

Python处理PDF文件需要安装相应的库:【PyPDF2】库

使用场景
工作中可能会涉及处理pdf文件,PyPDF2就是这样一个库, 使用它可以轻松的处理 pdf 文件,它提供了读、写、分割、合并、文件转换等多种操作。

安装库

网站

使用说明

PyPDF2 官方文档(documentation)

学习网站

博客

# 导入相关类
from PyPDF2 import PdfFileReader, PdfFileWriter
 
# 定义输入文件和输出文件(路径)
inputFile = \'read.pdf\'
outputFile = \'write.pdf\'

# 获取一个 PdfFileReader 对象 
pdfReader = PdfFileReader(open(inputFile, \'rb\')) 

# 获取 PDF 的页数 
pageCount = pdfReader.getNumPages() 
print(pageCount) 

# 返回一个 PageObject 
page = pdfReader.getPage(i) 

# 获取一个 PdfFileWriter 对象 
pdfWriter = PdfFileWriter() 

# 将一个 PageObject 加入到 PdfFileWriter 中 
pdfWriter.addPage(page) 

# 输出到文件中 
pdfWriter.write(open(outputFile, \'wb\'))

GitHub

提供了使用案例,当我们使用的时候再具体查看。

以上是关于Python应用PDF处理-pypdf2的主要内容,如果未能解决你的问题,请参考以下文章

技术博客——PyPDF2 & Reportlab 使用

处理PDF文档

Python - PyPdf2 合并不保持 PDF 大小

Python 不使用 pyPDF2 打印 PDF

使用 PyPDF2 从 PDF 文件中提取文本

在windows下安装PyPdf2