用于 pdf、chm 和 djvu 文件的桌面搜索实用程序 [关闭]
Posted
技术标签:
【中文标题】用于 pdf、chm 和 djvu 文件的桌面搜索实用程序 [关闭]【英文标题】:Desktop search utility for pdf,chm and djvu files [closed] 【发布时间】:2008-08-30 05:58:04 【问题描述】:我想写一个工具来帮助我在 linux 中搜索 pdf/chm/djvu 文件。关于如何去做的任何指示?
主要问题是从所有这些文件中读取/导入数据。这可以用 C 和 shell 脚本来完成吗?
【问题讨论】:
【参考方案1】:Tracker 随 Ubuntu 8.04 一起提供——这是从 Beagle 的一个重大转变,用户认为它过于占用资源 (CPU) 并且没有产生足够好的结果。它同时索引 pdf 和 chm,根据 this bug report 它还索引 djvu。
【讨论】:
【参考方案2】:请注意,djvu 是一种图像压缩格式(经过优化以压缩“文本图片”,通常是扫描结果)。因此,您将无法搜索文本,除非在元数据中 - 这是 cdleary 发送的链接所指的 -, 或 如果您首先在文档上使用 OCR 进行转换变成文字。
对于内容是扫描文章/书籍的 PDF 也是如此。
【讨论】:
【参考方案3】:Beagle 的插件怎么样?
它已经搜索了 PDF,但您可以添加其他文件类型。
这里是相关的***页面:http://en.wikipedia.org/wiki/Beagle_(software)
【讨论】:
以上是关于用于 pdf、chm 和 djvu 文件的桌面搜索实用程序 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章