在图像文件中查找一行
Posted
技术标签:
【中文标题】在图像文件中查找一行【英文标题】:Finding a line in an image file 【发布时间】:2013-08-13 18:23:45 【问题描述】:我正在尝试裁剪 PDF 边缘的打印机标记。
我想解决这个问题的路径如下: 将PDF转换为位图然后遍历位图并尝试找到线条,一旦找到线条,找到这些线条边缘的坐标,将裁剪坐标设置为刚刚找到的坐标。
但是,这种方法在我脑海中浮现的问题是如何知道行结束和实际页面何时开始。如何区分线条和字母。
如何克服这些障碍,或者有没有更好的方法从 PDF 中裁剪出打印机标记?
【问题讨论】:
【参考方案1】:没有适用于所有 PDF 文件的通用答案,但是现有的图形艺术解决方案实施了一些有用的策略,例如 callas pdfToolbox(观看它,我与此产品相关联)或 PitStop。这些策略围绕着一些事实:
修剪和出血标记通常是简单的线条(尽管有时也使用细长的矩形)。它们短而直(水平或垂直)。
这些标记通常以特定颜色绘制。将颜色设置为 100%、100%、100%、100% 的 CMYK 或 - 更常见的是 - 称为“全部”的特殊专色。您几乎可以放心,因为这些标记需要出现在每个印刷的分色上(如果您不熟悉印刷技术术语,请见谅)。
这些标记通常是对称镜像的。您不是在寻找单个标记 - 您正在寻找一组标记,这通常有助于识别。但请注意,您不会被不以绝对准确度放置标记的不良应用程序弄糊涂。
最后但在您的应用程序中可能并不重要,不同的区域实际上可以使用不同类型的标记。例如,日本修剪和出血标记看起来与欧洲或美国标记完全不同。
【讨论】:
以上是关于在图像文件中查找一行的主要内容,如果未能解决你的问题,请参考以下文章
在 .txt 文件中查找并替换 pdftotext 生成的图像字符