pdf内容的索引和搜索

Posted

技术标签:

【中文标题】pdf内容的索引和搜索【英文标题】:Indexing and searching of pdf content 【发布时间】:2011-09-25 17:38:34 【问题描述】:

我一直在寻找 Iphone 编程方法来搜索和索引下载的 pdf 文档。我想要制作的应用程序将能够在设备上下载 pdf 文件并将其作为各种 pdf 文件存储在一个目录中,用户可以使用搜索功能,应该可以在所有文件中搜索到关键字。类似于MAC中的grep功能。 我的问题是在所有文件中快速搜索,因为我无法弄清楚进行索引的最佳方法是什么,以便快速搜索。

请提出建议。

谢谢, 大卫

【问题讨论】:

【参考方案1】:

我不禁认为最好的解决方案是在下载 pdf 并通过 core-data 访问数据库时将 pdf 的文本(稍后将搜索)转储到 sql 支持的数据库中。

【讨论】:

以上是关于pdf内容的索引和搜索的主要内容,如果未能解决你的问题,请参考以下文章

Jackrabbit Oak Lucine 索引和 SQL2 查询,用于在 txt 和 pdf 中进行全文搜索

ES实现网站搜索

以编程方式读取 PDF 嵌入式搜索索引

Lucene实现全文检索的流程

电子书 Lucence实战中文版第2版.pdf

PDF文本内容批量提取到Excel