在 pdf 文件中查找特定文本并使用文本打印文件名和行

Posted

技术标签:

【中文标题】在 pdf 文件中查找特定文本并使用文本打印文件名和行【英文标题】:Find specific text in pdf file and print file name and row with text 【发布时间】:2019-01-30 08:41:09 【问题描述】:

我在网上搜索过,但找不到我需要的答案。我需要在 Linux 环境中通过多个目录递归搜索名为“monthly_spd.pdf”的文件,以查找关键字短语,例如“MOS-corrected”然后打印找到“MOS-corrected”的那一行,并打印路径/文件名。

我在下面尝试过,我可以打印或显示文件/路径名,但我还没有弄清楚如何打印在每个文件中找到关键字短语(“MOS-corrected”)的行。谢谢。

 find . -name 'monthly_spd.pdf' -exec echo  \: -exec pdftotext  - \; | grep "MOS-corrected, r\|pdf"

【问题讨论】:

【参考方案1】:

我在下面的链接中找到了答案,方法是在我上面尝试的解决方案中的“grep”之后添加“-C5”以打印关键字短语周围的上下文,这正是我所需要的。请参阅 Colin D Bennett 的评论/评论!

How to search contents of multiple pdf files?

【讨论】:

以上是关于在 pdf 文件中查找特定文本并使用文本打印文件名和行的主要内容,如果未能解决你的问题,请参考以下文章

使用 Qt 打印 PDF 文件

在文本文件中查找特定单词并计算它

打印PDF文件但文本框显示不了

从pdf文件中提取特定数据

在 php 中使用 grep 命令在特定文件中查找字符串

Linux Shell 文本处理工具