数字图像处理PDF文字倾斜旋转校正

Posted wangzming

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数字图像处理PDF文字倾斜旋转校正相关的知识,希望对你有一定的参考价值。

Title: PDF文字倾斜旋转

 

Reference:

  ”电面中被问到了做的LPR,简单的介绍了下后又问到了关于如何矫正倾斜角的问题。答得比较含糊,所以今天来补充一下。

倾斜矫正的方法有很多种,包括基于Hough变换的矫正,基于字符投影的倾角矫正,常规线性角度检测等等。这里因为前段时间刚刚写过关于Hough变换的东西,所以实践一下。

其基本思想是找出边缘直线,并根据直线找出倾角后进行旋转。

对于噪声较少的一些图像,做二值化处理后噪声也较少,利用合适的膨胀处理后文字自然连接成长条状以便于进行边缘的检测。找到最长的边缘线,并计算出倾角。

这是一种比较简单的方法,比较容易理解,但缺点也比较明显。首先是鲁棒性非常的差,很容易受噪声的影响,图像质量稍微不好就容易出现误差。另外通过hough变换的计算量也偏大。改进方法有很多,包括通过建立连通域并寻找中心。"

 

Aim: 

    去除水印/超链接

 

工具/原料

    Adobe Acrobat pro: 文档处理工具。

    Adobe Acrobat x pro 序列号

    2899 4352 1000 2750 9286 4319

    1118-1905-0841-9679-7056-1416

    1118-1830-9169-0893-9620-7260

 

    Adobe Acrobat XI V11.0.0

                   链接:https://helpx.adobe.com/cn/acrobat/kb/acrobat-10-11-downloads.html

                   序列号:1118-1640-4948-9571-0409-0624

    enfocus pitstop pro 12:网盘找

    enfocus pitstop pro破解版:用某破解工具替换dll

 

方法步骤:

  Step1. 安装Acrobat

  Step2. 安装插件

  Method 1.只用Acrobat去除水印(适用范围:只对Acrobat自己生成的水印有效)

  Method 2.Pitstop Pro 12

  一个Acrobat的很大的插件,大概300M。也需要破解。

  官网:http://www.enfocus.com/en/products/pitstop-pro#requirements

  软件下载地址http://esko-dl.asknet.com/Enfocus_PP_12.exe

  Pitstop的破解方法:Pitstop 12 Pro Crack.7z

  “下载Enfocus Pitstop安装文件安装,安装成功后开启并关闭一次Acrobat。然后删除以下文件:C:/Program Files/Adobe/Acrobat 9.0(这里也可以是7或8)/plug_ins/Enfocus/Resources/ipworks6.dll,C:/Documents and Settings/用户名(一般是Addministrator)/Application Data/Enfocus Prefs Folder/PitStop Professional/pp7eskf(隐藏文件)。再次打开Acrobat,在Pitstop弹出窗口里输入以下Enfocus Pitstop 序列号:SN:____,用户名和组织号任填。”

  Step3. 删除页脚水印指导

          >> FreeText类型水印

                   http://www.epinv.com/post/157.html

    针对批注中的FreeText类型的水印,可以直接诶左键选择,然后删除,但是无法批量操作。

         >> 简书教程 https://www.jianshu.com/p/dd2b2175933e

 

总结

  流程就是:下载并安装Acrobat,然后破解Pitspro。其他的方法包括用ABBYY Transformer。以上方法能够去掉的水印也只局限在文字跟水印没有重叠的情况,而且批量的时候还有缺漏的BUG,而且经实验,平均1页转换的时间远大于1s, 想想PDF经常是几百页的,emmmm... 还有优化空间。

 

以上是关于数字图像处理PDF文字倾斜旋转校正的主要内容,如果未能解决你的问题,请参考以下文章

图像倾斜校正算法的MATLAB实现:图像倾斜角检测及校正

求MATLAB图像处理的程序:倾斜图像的检测与校正。最后的结果是要那个倾斜角度和校正后的图像

怎么把图片上的字体提取出来?

opencv图像倾斜校正和切边

android中如何用opencv处理倾斜校正的问题,求源代码

用于 OCR 的 Python OpenCV 偏斜校正