如何通过命令行比较两个pdf文件[关闭]

Posted

技术标签:

【中文标题】如何通过命令行比较两个pdf文件[关闭]【英文标题】:How to compare two pdf files through command line [closed] 【发布时间】:2012-06-15 19:11:20 【问题描述】:

有谁知道如何通过命令行使用 adobe acrobat 比较两个 pdf 文件。 我想通过命令行执行此操作,因为我们想通过一些自动化的 Windows 任务每天比较数百个文件。

任何形式的帮助都会很大。如果有其他可用的东西,我不想将自己限制在 acrobat 中进行比较。

【问题讨论】:

命令行结果到底应该告诉你什么? '两个文件之间存在视觉差异''输入文件在视觉上没有不同。' ?!?还是您想要一个新的 PDF 来突出显示可以发现的差异?!) 您是在寻找非付费软件程序,还是对付费软件应用程序感兴趣? 【参考方案1】:

i-net PDFC 怎么样 - 它会进行完整的内容比较 - 文本、图像、行、页眉/页脚检测等。您可以在命令行或 GUI(2.0,目前处于公开测试阶段)中使用它。

命令行工具已经具有将文件夹与 PDF 相互比较的选项(或极端方式:使用 API ;))

免责声明:是的,我为制作此内容的公司工作 - 非常感谢您的反馈。

【讨论】:

该软件很棒,但非常昂贵:每年 180 欧元! (考虑到我每月使用一次或两次) 好吧。当然,这取决于用例。我们现在是 v5,多年来进行了许多改进。您始终可以在每个主要版本中免费旋转桌面应用程序。我们网站上有一个公开演示,可能会满足您的个人需求。【参考方案2】:

查看comparepdf:

comparepdf 是一个用于比较两个 PDF 文件的命令行工具。默认情况下,它会比较它们的文本,但它也可以直观地比较它们(例如,检测图表、图像、字体和布局的变化)。它应该对自动化测试很有用。

它是开源 (GPL) 并且有 Windows binaries 可用。

还有:

如果您想要一个显示 PDF 之间详细差异的 GUI 应用程序,请改用 DiffPDF。

【讨论】:

中的信息不再有效:(1)comparepdf,不管命令行与否,只在Windows上运行,(2)它不是开源的。 @yannis,链接好像过期了,GPL cmdline 工具的新链接是qtrac.plus.com/comparepdf.html,我已经提交了更新,不知道会不会被批准。 【参考方案3】:

Adobe Acrobat 无法通过命令行完成您想要的工作。但是,您可以在一些命令行实用程序的帮助下完成此操作,您可以将这些实用程序合并到一个 shell 或批处理脚本中。

1。快速目视检查页面图像差异

其中一个成分是 ImageMagick 的 convert 命令,您可以像这样对两个页面内容相似的 1 页 PDF 文件进行测试:

convert -label '%f' -density '100' first.pdf second.pdf -scale '100%' miff:- \
 | montage - -geometry +0+0 -tile 1x1 -background white miff:- \
 | animate -delay '50' -dispose background -loop 0 -

这将打开一个窗口,在显示两个文件之间以 50 dezi 秒的延迟切换,因此很容易发现视觉差异。

2。生成 PDF 输出的脚本,可视化 PDF 文件之间的差异

我在 Linux 上使用一个 shell 脚本来做同样的事情

    ImageMagick 的compare 命令 pdftk 实用程序 Ghostscript(可选)

(将其移植到 DOS/Windows 的 .bat 批处理文件会相当容易。)

你可以read details about this approach in this answer

【讨论】:

以上是关于如何通过命令行比较两个pdf文件[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

一个用于合并pdf的简单Python脚本

通过 Windows 命令行将 TIFF 转换为 PDF [关闭]

怎样比较两个PDF文档的差异

如何使用命令行工具将高清 PDF 转换为低分辨率?

一个pdf一个WORD文件,想核对一下两个是不是完全一样,有啥方法?

比较大量 PDF 文件的工具? [关闭]