Java Pdf Diff库

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java Pdf Diff库相关的知识,希望对你有一定的参考价值。

有没有人知道一个开源Java库,它会对pdf文件的文本部分进行强大的差异化?

理想情况下,我希望能够以补丁的形式产生差异。

答案

使用http://incubator.apache.org/pdfbox/提取pdf文本并使用http://code.google.com/p/google-diff-match-patch创建差异。

另一答案

如果PDF仅在文本中有所不同,您还可以栅格化页面,然后查看这种差异 - 我们将其用于PDF代码的回归测试输出。

另一答案

你可以看看xdiffweb.com。这是一个基于apache pdfbox的纯java开源项目。

以上是关于Java Pdf Diff库的主要内容,如果未能解决你的问题,请参考以下文章

JGit 中的 git diff 等价物

如何使用 git diff 比较不在存储库中的两个远程文件?

gitlog和diff区别

您如何获取 git diff 文件,并将其应用到作为同一存储库副本的本地分支?

方法级别的 Git Diff

gitGit diff 常见用法