解析 XPS 或 PDF 并将数据插入 Word 模板?

Posted

技术标签:

【中文标题】解析 XPS 或 PDF 并将数据插入 Word 模板?【英文标题】:Parsing XPS or PDF and inserting data into a Word Template? 【发布时间】:2013-07-04 00:53:33 【问题描述】:

因此,我可以选择从数据库发送文档以 PDF 或 XPS 格式打印。我需要能够从其中一种格式中提取特定数据,例如姓名、日期等,并将该数据插入到 word 模板中。单词模板不可编辑。您只能在字段内输入...每个字段前面都有一个标题,例如姓名、出生日期等。

基本上,我需要能够自动将该信息从 PDF 或 XPS 文件传输到 word 模板中。

我对 C++、Python 和 Java 已经足够熟悉了。所以我没有语言偏好——只要能完成这项工作。

您能否建议我可以设法完成此任务的方法?我在弄清楚如何从其中一种文件类型中解析/提取数据以及哪种文件类型是更好的候选者时遇到了一些困难。而且我绝对不知道如何自动化 Word 模板中的字段填充。

哦,忘了提,这是在 Windows 7(可能是 8,但大多数是 7)机器上。

非常感谢您提前提供的帮助!

【问题讨论】:

在此站点中搜索[c++] parse pdf[c++] word automation,并尝试使用 Google 或 Bing。这个问题的范围太广了。这里的问题应该是具体的,并且每个帖子仅限于一个可回答的问题。您问了三个问题(解析 PDF、解析 XPS 和填充 Word 模板),但都太模糊了,无法回答。 @Ken White 听起来不错,谢谢。 【参考方案1】:

这适用于任何有相同问题的人,所以我就是这样做的:

我使用 PDFBox (http://pdfbox.apache.org/) 来解析文档并提取所需的数据,然后我使用 docx4j (http://www.docx4java.org/trac/docx4j) 将数据插入到 word 模板中。两者都是令人难以置信的工具,并且拥有几乎可以立即提供帮助的优秀社区。​​p>

【讨论】:

以上是关于解析 XPS 或 PDF 并将数据插入 Word 模板?的主要内容,如果未能解决你的问题,请参考以下文章

Java 将PDF/XPS转为Word/html /SVG/PS/PCL/PNGPDF和XPS互转(基于Spire.Cloud.SDK for Java)

word导出PDF出现“由于出现意外错误,导出失败”怎么解决

Java 将Word转为PDF/Html/图片/XPS/SVG(基于Spire.Cloud.SDK

WPF中怎么显示PPT文件

Adobe Acrobat 7.0 Professional 当Word转化PDF时出现PDFMaker文件丢失 怎么办?急

Word转PDF文件,如何在PDF中嵌入字体