用Python做图像处理
Posted 赖勇浩
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用Python做图像处理相关的知识,希望对你有一定的参考价值。
用Python做图像处理
最近在做一件比较 evil 的事情——验证码识别,以此来学习一些新的技能。因为我是初学,对图像处理方面就不太了解了,欲要利吾事,必先利吾器,既然只是做一下实验,那用 Python 来作原型开发再好不过了。在 Python 中,比较常用的图像处理库是 PIL(Python Image Library),当前版本是 1.1.6 ,用起来非常方便。大家可以在
http://www.pythonware.com/products/pil/index.htm 下载和学习。
在这里,我主要是介绍一下做图像识别时可能会用到的一些 PIL 提供的功能,比如图像增强、还有滤波之类的。最后给出使用 Python 做图像处理与识别的优势与劣势。
基本图像处理
使用 PIL 之前需要 import Image 模块:
import Image
然后你就可以使用Image.open(‘xx.bmp’) 来打开一个位图文件进行处理了。打开文件你不用担心格式,也不用了解格式,无论什么格式,都只要把文件名丢给 Image.open 就可以了。真所谓 bmp、jpg、png、gif……,一个都不能少。
img = Image.open(‘origin.png’) # 得到一个图像的实例对象 img
data:image/s3,"s3://crabby-images/4d455/4d4551456102c42d5689d8698d6ea1b82dabc3ee" alt=""
图 1原图
图像处理中,最基本的就是色彩空间的转换。一般而言,我们的图像都是 RGB 色彩空间的,但在图像识别当中,我们可能需要转换图像到灰度图、二值图等不同的色彩空间。 PIL 在这方面也提供了极完备的支持,我们可以:
new_img = img.convert(‘L’)
把 img 转换为 256 级灰度图像, convert() 是图像实例对象的一个方法,接受一个 mode 参数,用以指定一种色彩模式,mode 的取值可以是如下几种:
· 1 (1-bit pixels, black and white, stored with one pixel per byte)
· L (8-bit pixels, black and white)
· P (8-bit pixels, mapped to any other mode using a colour palette)
· RGB (3x8-bit pixels, true colour)
· RGBA (4x8-bit pixels, true colour with transparency mask)
· CMYK (4x8-bit pixels, colour separation)
· YCbCr (3x8-bit pixels, colour video format)
· I (32-bit signed integer pixels)
· F (32-bit floating point pixels)
怎么样,够丰富吧?其实如此之处,PIL 还有限制地支持以下几种比较少见的色彩模式:LA (L with alpha), RGBX (true colour with padding) and RGBa (true colour with premultiplied alpha)。
下面看一下 mode 为 ‘1’、’L’、’P’时转换出来的图像:
data:image/s3,"s3://crabby-images/4a9fd/4a9fd3697e4b5e2e2f0e0f552c1adf7089f66dd3" alt=""
图 2 mode = '1'
data:image/s3,"s3://crabby-images/1c8bd/1c8bd37bc6ab5ae3d2662e942e2136afb09b989f" alt=""
图 3 mode = 'L'
data:image/s3,"s3://crabby-images/be491/be491eb4d4568aba2aff928feb8df6419375446f" alt=""
图 4 mode = 'P'
convert() 函数也接受另一个隐含参数 matrix,转换矩阵 matrix 是一个长度为4 或者16 tuple。下例是一个转换 RGB 空间到 CIE XYZ 空间的例子:
rgb2xyz = (
0.412453, 0.357580, 0.180423, 0,
0.212671, 0.715160, 0.072169, 0,
0.019334, 0.119193, 0.950227, 0 )
out = im.convert("RGB", rgb2xyz)
除了完备的色彩空间转换能力外, PIL 还提供了resize()、rotate()等函数以获得改变大小,旋转图片等几何变换能力,在图像识别方面,图像实例提供了一个 histogram() 方法来计算直方图,非常方便实用。
图像增强
图像增强通常用以图像识别之前的预处理,适当的图像增强能够使得识别过程达到事半功倍的效果。 PIL 在这方面提供了一个名为 ImageEnhance 的模块,提供了几种常见的图像增强方案:
import ImageEnhance
enhancer = ImageEnhance.Sharpness(image)
for i in range(8):
factor = i / 4.0
enhancer.enhance(factor).show("Sharpness %f" % factor)
上面的代码即是一个典型的使用 ImageEnhance 模块的例子。 Sharpness 是 ImageEnhance 模块的一个类,用以锐化图片。这一模块主要包含如下几个类:Color、Brightness、Contrast和Sharpness。它们都有一个共同的接口 .enhance(factor) ,接受一个浮点参数 factor,标示增强的比例。下面看看这四个类在不同的 factor 下的效果
data:image/s3,"s3://crabby-images/d09cb/d09cb02759863f22bb860d74ca97fd81ad0fe2f2" alt=""
data:image/s3,"s3://crabby-images/dffa1/dffa13bcb1f34c5fe526ded10e76f7f36cb7b539" alt=""
data:image/s3,"s3://crabby-images/aabe1/aabe12541531a1ccff369c62fbb48393084b7737" alt=""
data:image/s3,"s3://crabby-images/d239f/d239f7aefbda4100628317eafe068800e3df5081" alt=""
data:image/s3,"s3://crabby-images/73352/7335238b22ddfdb6da610828b3beaa619dc1f260" alt=""
data:image/s3,"s3://crabby-images/f8d49/f8d492336f421d9e410d9da13ee6aaf78031a5a5" alt=""
data:image/s3,"s3://crabby-images/ba908/ba9082d0f3930b8debb3a5bebea6466366cc5ac9" alt=""
data:image/s3,"s3://crabby-images/a8e56/a8e567fd3c725a79051f74e9ad060a2875d5ed80" alt=""
data:image/s3,"s3://crabby-images/312c4/312c4513d7a64d064656a4b5cc08c4226640488e" alt=""
图 5 使用Color 进行色彩增强,factor 取值 [0, 4],步进 0.5
data:image/s3,"s3://crabby-images/b98f4/b98f4dafa18d809c5c400b76618fef4cdc540cf3" alt=""
data:image/s3,"s3://crabby-images/ace68/ace680a24c6ca429dab59a8224e1311ada59f143" alt=""
data:image/s3,"s3://crabby-images/502ef/502ef0007f36f11b908af99a7793afc9e771c1db" alt=""
data:image/s3,"s3://crabby-images/1eb3f/1eb3ff4cd8467f41a8ca811f509d3451034db13d" alt=""
data:image/s3,"s3://crabby-images/52227/522277566be5cbf50c7c26a7e643d460ef7aeae0" alt=""
data:image/s3,"s3://crabby-images/76663/76663a7568b3c267b68434cbbb297d7841e3d0e4" alt=""
data:image/s3,"s3://crabby-images/545f8/545f84fd3fea7ceec170a378d7bc2edfc8101330" alt=""
data:image/s3,"s3://crabby-images/c71e5/c71e54fc98378172cdbb0b52a3bdf34a0a318fc2" alt=""
data:image/s3,"s3://crabby-images/fdeda/fdeda0ac0d988f918eb6913879169c36a29c929e" alt=""
图 6 用 Birghtness 增强亮度,factor取值[0,4],步进0.5
data:image/s3,"s3://crabby-images/470f4/470f49e5e340350886888b551e6554fdd8200ea3" alt=""
data:image/s3,"s3://crabby-images/17aab/17aab64a07b6aad4b46cfe4b9aeca212de11e9a7" alt=""
data:image/s3,"s3://crabby-images/74b39/74b39246244c450f472f4893d0f2abd83e3fad23" alt=""
data:image/s3,"s3://crabby-images/a79a6/a79a69324810e1499e69a34be4a67f3f2f1ce5e4" alt=""
data:image/s3,"s3://crabby-images/8cf1a/8cf1a4387af00c621d05d46a763499caeb525cd4" alt=""
data:image/s3,"s3://crabby-images/f49ff/f49ffe4e9c3a6012891745e5ad1c87fd6f457174" alt=""
data:image/s3,"s3://crabby-images/7644a/7644a5855330a375c42d8a8d8da9880a45365e11" alt=""
data:image/s3,"s3://crabby-images/79c0b/79c0b8a5efac3169bd9e2c26ab5db892f2cfcebb" alt=""
data:image/s3,"s3://crabby-images/a0d0a/a0d0abdd03f11081e0bb928b129d33c748250cba" alt=""
图 7用 Contrast 增强对比度, factor 取值 [0,4],步进0.5
data:image/s3,"s3://crabby-images/49e91/49e911ee4cc6779879e6256aa67281a363db1a9e" alt=""
data:image/s3,"s3://crabby-images/384d8/384d84730f4075131c6df1de5e15af1e58ef49fa" alt=""
data:image/s3,"s3://crabby-images/820b7/820b717aa997bd6354516bec51900dae1e4b9082" alt=""
data:image/s3,"s3://crabby-images/b8561/b8561ee9cac54390d4d85050e8edb4328b114f61" alt=""
data:image/s3,"s3://crabby-images/8fbd8/8fbd86cc2d97e7e759bfe78ff6396b956948f1e8" alt=""
data:image/s3,"s3://crabby-images/e8c86/e8c860b6e2387b7064700e79d7053ce5f3f8f894" alt=""
data:image/s3,"s3://crabby-images/f5b51/f5b518bf2fb97be83699093cde0bcf02b6048a04" alt=""
data:image/s3,"s3://crabby-images/ad5b8/ad5b885d7dd8199bca05065baae0fe6e2917e1b1" alt=""
data:image/s3,"s3://crabby-images/28d59/28d59a56efc9f9792f84878f0f1c8a14d53de35a" alt=""
图 8用 Sharpness 锐化图像,factor取值 [0,4],步进0.5
图像 Filter
PIL 在 Filter 方面的支持是非常完备的,除常见的模糊、浮雕、轮廓、边缘增强和平滑,还有中值滤波、ModeFilter等,简直方便到可以做自己做一个Photoshop。这些 Filter 都放置在 ImageFilter 模块中,ImageFilter主要包括两部分内容,一是内置的 Filter,如 BLUR、DETAIL等,另一部分是 Filter 函数,可以指定不同的参数获得不同的效果。示例如下:
import ImageFilter
im1 = im.filter(ImageFilter.BLUR)
im2 = im.filter(ImageFilter.MinFilter(3))
im3 = im.filter(ImageFilter.MinFilter()) # same as MinFilter(3)
可以看到 ImageFilter 模块的使用非常简单,每一个 Filter 都只需要一行代码就可调用,开发效率非常高。
data:image/s3,"s3://crabby-images/68117/6811717a3eefb048e4e1e1cd00643c8b25e645c9" alt=""
图 9使用 BLUR
data:image/s3,"s3://crabby-images/c5cbc/c5cbcbafdaab569120ddbf520368f3abc8a4acf6" alt=""
图 10使用 CONTOUR
data:image/s3,"s3://crabby-images/d5316/d5316ee314a592abcc45d3d2f6e3ce5846929b74" alt=""
图 11使用 DETAIL
data:image/s3,"s3://crabby-images/d208b/d208b723998d0eeaa3f7bf432e7043b8b7d72d51" alt=""
图 12使用 EMBOSS
data:image/s3,"s3://crabby-images/3812a/3812ad05940baa85c33074602c232d280c4e715f" alt=""
图 13使用 EDGE_ENHANCE
data:image/s3,"s3://crabby-images/693d2/693d2e916f06efb64953c2ca4eeef0fd7b39f9db" alt=""
图 14使用 EDGE_ENHANCE_MORE
data:image/s3,"s3://crabby-images/084c6/084c682f5e01eb9b6769111ee12debd0e69cf957" alt=""
图 15使用 FIND_EDGES
data:image/s3,"s3://crabby-images/2edf2/2edf2f165a3a931b02eec5ee44f3439c2d8ded6d" alt=""
图 16使用 SHARPEN
data:image/s3,"s3://crabby-images/74be6/74be67b917f71ed48bf4f655837703a7248b90db" alt=""
图 17使用 SMOOTH
data:image/s3,"s3://crabby-images/f91b5/f91b589308f342fa15c252ede7fc2350e3af4949" alt=""
图 18使用 SMOOTH_MORE
以上是几种内置的 Filter 的效果图,除此之外, ImageFilter 还提供了一些 Filter 函数,下面我们来看看这些可以通过参数改变行为的 Filter 的效果:
data:image/s3,"s3://crabby-images/4eb51/4eb5116eca3d6e2361dc73a76611085993bbe139" alt=""
图 19使用 Kernel(),参数:size = (3, 3), kernel = (0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5)
data:image/s3,"s3://crabby-images/6ee42/6ee42bf2ce8880a00ccb7d5ab3b11ad5a0970bf8" alt=""
图 20使用 MaxFilter,默认参数
data:image/s3,"s3://crabby-images/6a6eb/6a6eb3ac9543d1f5d07921bac64d6e8158175973" alt=""
图 21使用 MinFilter,默认参数
data:image/s3,"s3://crabby-images/d4476/d4476812c86469a9c1f942a2d1d98246133aa889" alt=""
图 22使用 MedianFilter,默认参数
data:image/s3,"s3://crabby-images/4cb35/4cb35d03486a894063814a6ee7510f89623c2c93" alt=""
图 23使用 ModeFilter,参数 size = 3
data:image/s3,"s3://crabby-images/75cc6/75cc61a1085357c4793af764fd01fb5344fce90d" alt=""
图 24使用 RankFilter,参数 size = 3, rank = 3
小结
到此,对 PIL 的介绍就告一段落了。总的来说,对于图像处理和识别,PIL 内建了强大的支持,从各种增强算法到 Filter ,都让人无法怀疑使用 Python 的可行性。 Python唯一的劣势在于执行时间过慢,特别是当实现一些计算量大的算法时候,需要极强的耐心。我曾用 Hough Transform(霍夫变换)来查找图像中的直线,纯 Python 的实现处理一个 340 * 100 的图片也要花去数秒时间(P4 3.0G + 1G memory)。但使用 PIL 无需关注图像格式、内建的图像增强算法和 Filter 算法,这些优点使 Python 适合用于构造原型和进行实验,在这两方面Python 比 matlab 更加方便。商业的图像识别产品开发,可以考虑已经被 boost accepted的来自 adobe 的开源 C++ 库 gil,可以兼顾执行性能和开发效率。
以上是关于用Python做图像处理的主要内容,如果未能解决你的问题,请参考以下文章
Pandas必会的方法汇总,用Python做数据分析更加如鱼得水!(附代码)