如何从pdf文件中查找页眉页脚
Posted
技术标签:
【中文标题】如何从pdf文件中查找页眉页脚【英文标题】:how to find header footer from pdf files 【发布时间】:2012-06-10 15:15:05 【问题描述】:我想从 pdf 文件中查找/提取页眉或页脚。 我知道它可以通过 apose.net 库完成,但它不是免费的。我搜索了互联网,但找不到用于提取页眉或页脚的免费库。
许多像 itextsharp 这样的库只能添加页眉或页脚,但不能 提取或查找页眉或页脚。
我没有找到任何提取页眉或页脚的方法。
我该怎么做?
【问题讨论】:
这个问题是用什么语言编写的? 可以是任何语言。 @来新初 @lai xin chu---语言不重要。我只想找到作为文本/字符串的页眉或页脚的方法。我想知道语言有什么问题?如果某人是一个优秀的程序员,那么他可以很容易地理解任何编程语言的过程。只有你我才知道 java/c# 和 c++。 只是询问是否提供了示例代码。放松。您还必须考虑库的可用性。 技术上 PDF 不包含页眉/页脚 【参考方案1】:页眉和页脚在整个文档上应该具有相同的结构,所以我认为这是一个很好的开始。您可以搜索一些模式,然后提取页眉/页脚。然后你可以使用像itextsharp
这样的库来提取这个值,有用的方法:
PdfTextExtractor.GetTextFromPage(reader, fromPage, toPage);
【讨论】:
这个方法我已经用过了。我有一个 pdf,它有几个空白页,但从那个页面我通过 GetTextFromPage() 方法得到一些文本。并且所有空白页面的文本都不相同。所以我不能在特定模式上使用搜索方法。以上是关于如何从pdf文件中查找页眉页脚的主要内容,如果未能解决你的问题,请参考以下文章