Python应用——自定义函数:分割PDF文件函数

Posted 既生喻何生亮(Bright)

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python应用——自定义函数:分割PDF文件函数相关的知识,希望对你有一定的参考价值。

案例

将一个 pdf 文件按要求分割为几个部分。比如说一个pdf有20页,分成5个pdf文件,每个pdf文件包含4页。设计函数实现?

Python代码

from PyPDF2 import PdfFileReader, PdfFileWriter
# 分割 pdf 函数定义
def splitPDF(input_pdf, out_num, split_site):

    for i in range(out_num):
        with open(input_pdf, 'rb') as open_pdf,                 open(str(i)+'.pdf', 'wb') as write_pdf:

            pdfReader = PdfFileReader(open_pdf)

            pdfWriter = PdfFileWriter()
            for j in range(i*split_site, (i+1)*split_site):
                page = pdfReader.getPage(j)
                pdfWriter.addPage(page)

            pdfWriter.write(write_pdf)

# 测试函数
splitPDF('inputfile.pdf', 5, 4)
# 参数:输入PDF文件,分割份数(5个pdf文件),分割页数(每个PDF4页)

函数讲解

本函数是自己测试通过的函数,还有待优化。输入参数有,将要分割的PDF文件,分割为几个pdf文件,每个PDF文件页数。

测试结果
原来只有一个:inputfile.pdf 文件
运行之后为:0.pdf; 1.pdf; 2.pdf; 3.pdf; 4.pdf

以上是关于Python应用——自定义函数:分割PDF文件函数的主要内容,如果未能解决你的问题,请参考以下文章

图像分割 - Keras 中的自定义损失函数

pandas使用read_csv函数随机从文件中读取N行数据pandas使用read_csv函数读取空格分割的文件(space)自定义设置sep参数

php如何利用python实现对pdf文件的操作(读写合并分割)

python的自定义函数(函数类型defrangererun)

Python应用PDF处理-pypdf2

oracle自定义split分割函数