在 Windows 中保持打印到虚拟打印机的文档的可搜索性

Posted

技术标签:

【中文标题】在 Windows 中保持打印到虚拟打印机的文档的可搜索性【英文标题】:Maintaining the searchability of a document printed to a virtual printer in Windows 【发布时间】:2018-06-12 16:13:00 【问题描述】:

我需要在 Windows 上打印文档并在远程数据库中记录可搜索的 PDF。

目前,我可以打印到远程 CUPS 服务器,该服务器已修改为将 PDF 保存到数据库。但是我使用的每个 Windows 打印机驱动程序都使文档不可搜索(我可以通过使用驱动程序打印到文件来测试这一点,无论是 PostScript 还是打印到 PDF)。

我一直在考虑下一步是编写一个驱动程序或驱动程序插件,以保留文档的可搜索性。这意味着编写从EMF 文件转换为RAW 的代码,此处描述为https://docs.microsoft.com/en-us/windows-hardware/drivers/print/introduction-to-print-processors。

Writing a Windows Printer Driver 建议我可以使用一个简单的 UI 插件来做到这一点。

有没有更简单的方法来解决这个问题?会喜欢第二(或第三,或第四)意见。

【问题讨论】:

【参考方案1】:

是的,编写打印机驱动程序将是这里的方法。我认为编写驱动程序本身并不难,尽管我从未亲自做过。它们在用户模式下运行的事实比编写内核级驱动程序要容易得多。

要将这些 GDI 调用转换为 PDF,您应该寻找某种库,因为这是一项复杂的任务。给你一些信息here,否则...... Goooooooooooooogle!

【讨论】:

以上是关于在 Windows 中保持打印到虚拟打印机的文档的可搜索性的主要内容,如果未能解决你的问题,请参考以下文章

如何在Windows上使用Python 3.3.2直接打印到打印机?

Windows 中的 Java 文档打印

ubuntu beyond compare 怎么打开

从 Windows 8 应用程序打印 PDF 文档

如何在.Net中利用windows api函数打印一个文档

win8.1 属性-共享:Windows无法显示此连接的属性。WMI信息可能损坏