以编程方式读取 PDF 嵌入式搜索索引

Posted

技术标签:

【中文标题】以编程方式读取 PDF 嵌入式搜索索引【英文标题】:Programmatically read PDF embedded search index 【发布时间】:2013-02-23 01:47:39 【问题描述】:

可以使用 Acrobat pro(工具/文档处理/管理嵌入索引)和其他 3 方程序(例如 Nuance)将搜索索引嵌入到 PDF 中。

我正在为 iPad 用户编写一个应用程序,该应用程序在一定程度上允许高亮显示 pdf 文本搜索。有许多类,例如 pdfkitten 进行 pdf 搜索。有些 PDF 文件很大,使用这些类进行搜索需要 2 多分钟。

我希望能够直接访问嵌入式索引以加快搜索速度。我无法在我阅读的文档中找到有关索引位置或其格式的信息。我查看了 Adobe's 文档以及 Wikipedia 和其他 ISO 32000 文档,除了如何创建它之外,无法找到有关嵌入式索引的任何信息。

我很高兴获得描述索引以及如何访问它或任何类的信息。谢谢。

【问题讨论】:

你后来有没有找到这方面的信息? // @brian 【参考方案1】:

我们正在寻找完全相同的东西。这是 Adob​​e 的博客,我在其中提出了这个问题,Adobe 的回答是移动 Adob​​e Reader 不支持自定义页码和搜索索引。我现在正在为 iPad 寻找其他选项,它们可以像在台式机上一样有效地读取和索引搜索。

博客:http://blogs.adobe.com/readermobile/2013/03/06/reader-mobile-update/#comment-2235

希望以某种方式有所帮助。 -布赖恩

【讨论】:

以上是关于以编程方式读取 PDF 嵌入式搜索索引的主要内容,如果未能解决你的问题,请参考以下文章

在Drupal7中以编程方式嵌入搜索块的最佳方法

以编程方式搜索 PDF 文件中的文本并告知页码? [关闭]

如何在现有 PDF 中嵌入字体?

如何以编程方式在滚动视图中嵌入堆栈视图

如何从 PDF 中提取嵌入字体作为有效字体文件?

寻找嵌入了选项卡和导航控制器的视图控制器