Apache PDFBox的基本使用

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Apache PDFBox的基本使用相关的知识,希望对你有一定的参考价值。

参考技术A Apache PDFBox是一个处理PDF文档的开源JAVA工具库,此项目允许创建新的PDF文档、操作现有文档以及文档中提取内容。

使用Apache pdfbox: 从Linux安装字体到log4j设置日志级别

在使用Apache的pdfbox的过程中,因为Linux环境下没有STSong-Light字体而报警告信息

(PDCIDFontType0.java:147) - Using fallback UKaiCN for CID-keyed font STSong-Light

  搜索得知此为Adobe推出的一种OpenType字体,在adobe的安装目录下找到了疑似的字体AdobeSongStd-Light.otf,将此文件copy至Linux的/usr/share/fonts目录中,因为pdfbox会自己更新font-cache,所以没有手工更新font-cache,但是AdobeSongStd-Light.otf还不是STSong-Light,WARN信息改为了

(PDCIDFontType0.java:147) - Using fallback AdobeSongStd-Light for CID-keyed font STSong-Light

  将AdobeSongStd-Light.otf文件重命名为STSong-Light.otf依旧无法解决,使用notepad++打开文件,内容里有大量的AdobeSongStd-Light信息,看来此路不通。

 

于是将方向转为设置log4j日志级别,参考http://blog.csdn.net/zmx729618/article/details/51260803,将自有项目代码的日志级别调整为INFO,将第三方jar包的日志级别设为ERROR解决。

以上是关于Apache PDFBox的基本使用的主要内容,如果未能解决你的问题,请参考以下文章

PDFBox转图片问题汇总

使用Apache pdfbox: 从Linux安装字体到log4j设置日志级别

[PDFBox]后台操作pdf的工具类

利用pdfbox和poi抽取pdfdoc以及docx格式的内容

使用pdfbox分页保存pdf为图片

Apache PDFBox 删除字符之间的空格