使用 pdf 中可用的目录生成 pdf 中的索引

Posted

技术标签:

【中文标题】使用 pdf 中可用的目录生成 pdf 中的索引【英文标题】:Generating index in pdf using table of content available in pdf 【发布时间】:2018-03-29 20:59:20 【问题描述】:

我有一个基本上是 RTC 数据表的 pdf 文件, 不允许使用目录跳转到页面,并且左侧面板上没有索引或书签。http://www.horustech.com.tw/WebMaster/FileData/Epson/RX8900SA(SA;CE).pdf

现在我的问题是可以使用 ghostscript 或 pdftk 命令更新此 pdf 中的索引/书签吗?

【问题讨论】:

【参考方案1】:

您可以创建一个 *new** PDF 文件,并且可以添加一个新的 /Outlines 树(我相信它被 Acrobat 称为书签),但您必须通过创建 PostScript pdfmark 序列来完成操作。您必须自己构建这些,无法自动完成。

您还可以(更难)/Link 注释到目录,以便它可以跳转到相关的页面/区域。再次使用 Ghostscript,您必须通过手动创建 pdfmark 操作来执行此操作。

同样,这些都不能自动完成,必须手动创建 pdfmarks,尤其是目录中的超链接,如果您想这样做,几乎可以肯定使用交互式程序更好地处理这些。

我有理由确定您也可以使用 pdftk 执行此操作,但我再次认为您必须手动添加大纲或链接。

【讨论】:

我在想,如果 pdfmark 的创建可以自动化,那么它会很容易:(。谢谢你的回复。 当然,您可以自动创建 pdfmarks,但我不知道您将如何自动从 PDF 文件中提取数据以创建 pdfmarks。例如,PDF 文件的第一页可能不是第 1 页,因此如果您的目录有一个指向第 1 页的条目,您不仅需要从 PDF 文件中提取索引文本(已经是非微不足道且不是 100% 保证的问题)您还必须确定 PDF 文件中的哪一页是第 1 页。

以上是关于使用 pdf 中可用的目录生成 pdf 中的索引的主要内容,如果未能解决你的问题,请参考以下文章

使用freemarker生成的word文档,如何利用java代码将其转换为pdf格式?

需要将多个 pdf 合并为一个带有目录部分的 PDF

pdf内容的索引和搜索

如何从 pdfLaTeX 生成 PDF 索引? [关闭]

Windows 下 pdf2word 的可用软件记录

怎提取pdf中的图片? java代码! 望高手解决!谢