本机 C# pdf 阅读器 [关闭]
Posted
技术标签:
【中文标题】本机 C# pdf 阅读器 [关闭]【英文标题】:Native C# pdf reader [closed] 【发布时间】:2011-04-16 22:36:04 【问题描述】:我需要从 PDF 文件中提取文本。我找到了 iTextSharp 和 PDFBox,但它们都只是 Java 端口,为了使它们工作,我需要使用大量额外的 dll。
所以,我的问题是:是否有一些用于从 PDF 文件中提取文本的原生 C# 库?没有的话,写一个难吗?
【问题讨论】:
"没有的话是不是很难写?"如果不难,早就有人写了。 PDF Reader的可能重复 不,没有原生的,是的,这非常困难。 如果 iTextSharp 不能满足您的需求,那么您可能需要使用商业(付费)产品。是的,iTextSharp 是 Java 的一个端口,但它是用 c# 重写的,因此是托管代码。 @Jim iTextSharp/iText 也是付费产品,除非在开源项目中使用。 【参考方案1】:Docotic.Pdf library 可用于extract text from PDF 文件。
该库没有外部依赖项,并且是用 C# 编写的。 Docotic.Pdf 有四个editions。
免责声明:我为 Bit Miracle 工作。
【讨论】:
哇,你们确定你们的收费够了吗?也许你也可以要求一个非优先肢体...... 嗯,是的,有一个免费版本,但现在是 595 美元以上。太贵了!【参考方案2】:有PdfSharp
【讨论】:
PdfSharp 不支持文本提取!以上是关于本机 C# pdf 阅读器 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章