如何使用 ghostscript 从 S3 合并 PDF

Posted

技术标签:

【中文标题】如何使用 ghostscript 从 S3 合并 PDF【英文标题】:How to Merge PDFs from S3 using ghostscript 【发布时间】:2014-09-29 11:05:01 【问题描述】:

ghostscript 可以很好地将多个 pdf 文件合并为一个。当我们从我们的服务器合并文件时,它工作正常。现在,我想合并亚马逊 S3 中存在的 pdf 文件。

这可能吗?像

 gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf https://<bucket>.s3.amazonaws.com/pdf1.pdf http://<bucket>.s3.amazonaws.com/pdf2.pdf

【问题讨论】:

【参考方案1】:

不,你不能那样做。 Ghostscript 没有内置 http 客户端,它也需要随机访问文件,所以即使它确实可以运行,它也可能非常慢。

所有文件都必须通过本地操作系统的文件系统可用。

当然,原则上可以添加一个新的文件设备类型(类似于 %rom% 和 %ram%)来通过 http 进行文件访问。 Ghostscript 是开源的,因此您可以根据需要自行添加。

请注意,您不是在合并 PDF 文件,而是对源文件进行解释,并根据输入的标记内容创建一个全新的 PDF 文件。不是一回事。

【讨论】:

以上是关于如何使用 ghostscript 从 S3 合并 PDF的主要内容,如果未能解决你的问题,请参考以下文章

Ghostscript 在合并 PDF 时跳过字符

pdf的Ghostscript合并导致方向翻转

Ghostscript将ps与pdf文件合并并添加第一行(标题)

合并 PDF 的 Ghostscript 压缩结果

合并两个后记时 ghostscript 不保留页面级别参数

Ghostscript 将图像/表单与文本文件合并