是否可以使用ghostscript删除pdf中文本块的背景

Posted

技术标签:

【中文标题】是否可以使用ghostscript删除pdf中文本块的背景【英文标题】:Is it possible to remove the background of a text block in pdf using ghostscript 【发布时间】:2012-11-14 05:02:32 【问题描述】:

我正在尝试使用 ghost 脚本将 pdf 转换为 tif。是否可以使用幽灵脚本删除 pdf 中文本块(背面字体颜色)的背景(灰色)?我想将灰色背景替换为白色。

感谢您的帮助!!

【问题讨论】:

这似乎是一个类似于我已经回答过的问题***.com/questions/10856521/… 【参考方案1】:

我认为您不会得到解决问题的通用解决方案,因为在您的 PDF 中编码此类背景的方式有很多种,并且无法确定将此类背景与某些矩形形式区分开来的方法矢量图像。

PDF 本质上提供了一组工具,用于在某个矩形(页面)中定位字形和矢量图形以进行显示,并提供一些附加工具来添加一些交互性(例如表单)。因此,PDF 中的彩色背景通常是通过沿背景区域的边缘绘制一条线,用所需颜色填充此表单,并在其顶部放置字形和图形(文本和图像)来创建的。不过,还有其他运算符可以使用,它们的使用有很多变体,通常创建的表单不会标记为背景。

在answerDingo 在他的评论中提到了一个覆盖整个页面的矩形,实际上甚至更多(在相当常见的媒体框选择的情况下)被绘制(m:移动到角落; 4*l:画4条边线;h:关闭路径;f填表)。

因此,请提供有问题的 PDF 以供检查,也许您的文件有一些特定的解决方案。

【讨论】:

以上是关于是否可以使用ghostscript删除pdf中文本块的背景的主要内容,如果未能解决你的问题,请参考以下文章

是否可以使用ghostscript检查pdf是否受密码保护?

如何修剪PDF中不需要的文本?

带坐标的PDF文本提取

转换后的 tiff 文件 (GhostScript) 中缺少 Pdf 文本框标记

PDF - 使用 Ghostscript 以编程方式删除超链接

在 .bat 文件中使用 ghostscript 压缩 PDF - 缺少文本