Java Pdf Diff库
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java Pdf Diff库相关的知识,希望对你有一定的参考价值。
有没有人知道一个开源Java库,它会对pdf文件的文本部分进行强大的差异化?
理想情况下,我希望能够以补丁的形式产生差异。
答案
使用http://incubator.apache.org/pdfbox/提取pdf文本并使用http://code.google.com/p/google-diff-match-patch创建差异。
另一答案
如果PDF仅在文本中有所不同,您还可以栅格化页面,然后查看这种差异 - 我们将其用于PDF代码的回归测试输出。
另一答案
你可以看看xdiffweb.com。这是一个基于apache pdfbox的纯java开源项目。
以上是关于Java Pdf Diff库的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 git diff 比较不在存储库中的两个远程文件?