使用 pdf 中可用的目录生成 pdf 中的索引
Posted
技术标签:
【中文标题】使用 pdf 中可用的目录生成 pdf 中的索引【英文标题】:Generating index in pdf using table of content available in pdf 【发布时间】:2018-03-29 20:59:20 【问题描述】:我有一个基本上是 RTC 数据表的 pdf 文件, 不允许使用目录跳转到页面,并且左侧面板上没有索引或书签。http://www.horustech.com.tw/WebMaster/FileData/Epson/RX8900SA(SA;CE).pdf
现在我的问题是可以使用 ghostscript 或 pdftk 命令更新此 pdf 中的索引/书签吗?
【问题讨论】:
【参考方案1】:您可以创建一个 *new** PDF 文件,并且可以添加一个新的 /Outlines 树(我相信它被 Acrobat 称为书签),但您必须通过创建 PostScript pdfmark 序列来完成操作。您必须自己构建这些,无法自动完成。
您还可以(更难)/Link 注释到目录,以便它可以跳转到相关的页面/区域。再次使用 Ghostscript,您必须通过手动创建 pdfmark 操作来执行此操作。
同样,这些都不能自动完成,必须手动创建 pdfmarks,尤其是目录中的超链接,如果您想这样做,几乎可以肯定使用交互式程序更好地处理这些。
我有理由确定您也可以使用 pdftk 执行此操作,但我再次认为您必须手动添加大纲或链接。
【讨论】:
我在想,如果 pdfmark 的创建可以自动化,那么它会很容易:(。谢谢你的回复。 当然,您可以自动创建 pdfmarks,但我不知道您将如何自动从 PDF 文件中提取数据以创建 pdfmarks。例如,PDF 文件的第一页可能不是第 1 页,因此如果您的目录有一个指向第 1 页的条目,您不仅需要从 PDF 文件中提取索引文本(已经是非微不足道且不是 100% 保证的问题)您还必须确定 PDF 文件中的哪一页是第 1 页。以上是关于使用 pdf 中可用的目录生成 pdf 中的索引的主要内容,如果未能解决你的问题,请参考以下文章