在Javascript中将PDF拆分为单独的文件

Posted

技术标签:

【中文标题】在Javascript中将PDF拆分为单独的文件【英文标题】:Split PDF in separate file in Javascript 【发布时间】:2016-01-07 10:54:43 【问题描述】:

我有一个大的 pdf 文件,我想将它拆分为单独的 PDF 文件,每一页都在单独的文件中。

在 JS 中可以通过 node 模块做到这一点。

我搜索但在 npm 我只有将 html 转换为 pdf 的模块

【问题讨论】:

【参考方案1】:

经过大量搜索和几乎放弃,我最终发现 HummusJS 库可以做我想做的事!感谢@Taxilian

看到这个帖子How can I create a customized version of an existing pdf file with node.js?

【讨论】:

不错。另一个围绕好库的 nodejs 包装器。都能解决你的问题 似乎它确实包装了 HummusPDF “可执行文件”。另请参阅 pdfkit。 HummusJS 似乎结束了支持。有什么好的选择吗? github.com/jjwilly16/node-pdftk 这可能是拆分页面的潜在替代方案【参考方案2】:

PDF 格式过于复杂,无法通过 javascript 处理。找不到任何 js 库,做得很好

很容易使用其他pdf解析软件并从node.js运行它

使用pdftk分割pdf

pdftk input.pdf burst output output_%02d.pdf

并通过child-process运行它

var exec = require('child_process').exec,
    child;

child = exec('pdftk input.pdf burst output output_%02d.pdf',
  function (error, stdout, stderr) 
    console.log('stdout: ' + stdout);
    console.log('stderr: ' + stderr);
    if (error !== null) 
      console.log('exec error: ' + error);
    
);

pdftk split pdf with multiple pages

也许你可以找到使用pdftk的node模块,但是自己运行它太容易了

【讨论】:

感谢您的回答,但请检查我发现了什么! 还有一个很棒的库,叫做 scissors,它为 Node.js 包装了 pdftk - imo 比 HummusJS 更容易使用,但两者都应该工作。

以上是关于在Javascript中将PDF拆分为单独的文件的主要内容,如果未能解决你的问题,请参考以下文章

是否可以在 python 中将包含 JavaScript 图表的 html 文件转换为 PDF?

如何在javascript中将PDF文件转换为base64字符串

如何在 yii 视图中将内容拆分为列-单独的 div

在 Golang 和 MongoDB 中将路由拆分为单独的包

使用python将多页pdf文件拆分为多个pdf文件?

如何将我的 javascript 代码拆分为单独的文件?