PDFBox:拆分 pdf 和输出前缀

Posted

技术标签:

【中文标题】PDFBox:拆分 pdf 和输出前缀【英文标题】:PDFBox: split pdf and output prefix 【发布时间】:2012-12-10 14:58:58 【问题描述】:

我喜欢使用 PDFBox 从大 PDF 中提取单个页面。我所有的“真实”PDF 文件都位于一个目录中。因此,如果我提取一个页面,我喜欢将此页面保存到单个页面的不同目录中)。 (或将其输送到标准输出)

问题:有没有办法定义输出目录或输出前缀,例如-prefix=/tmp/pdf-snipped-

带有选项 PDFSplit seams 的 PDFBox 将拆分的页面存储在与源 pdf 相同的目录中。但这不是很好。

顺便说一句:在拆分之前复制源 pdf 不是一个选项,因为它们非常大(超过 1 GB)

【问题讨论】:

【参考方案1】:

回答我自己的问题:

看起来,没有选项(也没有隐藏)来定义输出前缀或输出文件名。

所以我决定下载并更改 PDFbox 源代码并添加一个新选项(“前缀”)来定义存储截断的 PDF 的路径或定义输出名称。

如果你有同样的问题,那么这就是我要走的路:

1.svn下载源:http://pdfbox.apache.org/downloads.html#scm 并根据需要更改此文件中的代码:

PDFBOX-source-root/pdfbox/src/main/java/org/apache/pdfbox/PDFSplit.java

2.使用maven构建自己的PDFBox版本: http://pdfbox.apache.org/building.html

【讨论】:

【参考方案2】:

选项 -outputPrefix 可用于定义要保存输出的位置。

【讨论】:

【参考方案3】:

outputPrefix 工作正常。此示例将页面写入c:\ 并将它们命名为docname-1.pdfdocname-2.pdf、...

java -jar pdfbox-app-2.0.20.jar PDFSplit -split 1 -outputPrefix C:\docname original.pdf

【讨论】:

以上是关于PDFBox:拆分 pdf 和输出前缀的主要内容,如果未能解决你的问题,请参考以下文章

java 怎么把pdf转成word

使用 pdfbox 编辑 pdf 页面

PDFBox 生成的 PDF 尺寸(高度和宽度)被交换

使用 PDFBOX 填写 PDF 表单中的多个字段并在填写后锁定编辑 pdf 文档

icepdf和pdfbox转pdf文档为图片

[PDFBox]后台操作pdf的工具类