用于 pdf、chm 和 djvu 文件的桌面搜索实用程序 [关闭]

Posted

技术标签:

【中文标题】用于 pdf、chm 和 djvu 文件的桌面搜索实用程序 [关闭]【英文标题】:Desktop search utility for pdf,chm and djvu files [closed] 【发布时间】:2008-08-30 05:58:04 【问题描述】:

我想写一个工具来帮助我在 linux 中搜索 pdf/chm/djvu 文件。关于如何去做的任何指示?

主要问题是从所有这些文件中读取/导入数据。这可以用 C 和 shell 脚本来完成吗?

【问题讨论】:

【参考方案1】:

Tracker 随 Ubuntu 8.04 一起提供——这是从 Beagle 的一个重大转变,用户认为它过于占用资源 (CPU) 并且没有产生足够好的结果。它同时索引 pdf 和 chm,根据 this bug report 它还索引 djvu。

【讨论】:

【参考方案2】:

请注意,djvu 是一种图像压缩格式(经过优化以压缩“文本图片”,通常是扫描结果)。因此,您将无法搜索文本,除非在元数据中 - 这是 cdleary 发送的链接所指的 -, 如果您首先在文档上使用 OCR 进行转换变成文字。

对于内容是扫描文章/书籍的 PDF 也是如此。

【讨论】:

【参考方案3】:

Beagle 的插件怎么样?

它已经搜索了 PDF,但您可以添加其他文件类型。

这里是相关的***页面:http://en.wikipedia.org/wiki/Beagle_(software)

【讨论】:

以上是关于用于 pdf、chm 和 djvu 文件的桌面搜索实用程序 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

DJVU格式文件转PDF小软件

免费PDF阅读器 - Sumatra PDF

免费PDF阅读器 - Sumatra PDF

.chm 文件转换为 pdf文件

如何将pdf合成制作成chm格式?

chm 转 pdf 工具推荐与对比