Python图像处理-Pillow

Posted 2021-01-12 pywjh

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python图像处理-Pillow相关的知识，希望对你有一定的参考价值。

什么是验证码？

验证码（CAPTCHA）是“Completely Automated Public Turing test to tell Computers and Humans Apart”（全自动区分计算机和人类的图灵测试）的缩写。
是一种用来区分用户是计算机还是人的公共全自动程序。

验证码的作用
认证码是一种人机识别手段，最终目的是区分正常用户和机器的操作。
可以防止：恶意破解密码、注册、刷票、论坛灌水，防止黑客对用户的密码进行暴力破解。
一般是提出一个问题，这个问题可以由计算机生成并评判，但是必须只有人类才能解答。由于计算机无法解答这个的问题，所以回答出问题的用户就可以被认为是人类。
验证码的类别

验证码自面世以来就一直在更新，迭代。
图形验证码：这类验证码大多是计算机随机产生一个字符串，在把字符串增加噪点、干扰线、变形、重叠、不同颜色、扭曲组成一张图片来增加识别难度。
滑动验证码：也叫行为验证码，比较流行的一种验证码，通过用户的操作行为来完成验证，其中最出名的就是极验。
滑动验证码的原理就是使用机器学习中的深度学习技术，根据一些特征来区分是否为正常用户。通过记录用户的滑动速度，还有每一小段时间的瞬时速度，用户鼠标点击情况，以及滑动后的匹配程度来识别。而且，不是说滑动到正确位置就是验证通过，而是根据特征识别来区分是否为真用户，滑到正确位置只是一个必要条件。
点触验证码：点击类验证码都是给出一张包含文字的图片，通过文字提醒用户点击图中相同字的位置进行验证。

简介

Python传统的图像处理库PIL（Python Imaging Library），可以说基本上是Python处理图像的便准库，功能强大，使用简单。

但是由于PIL不支持Python3，而且更新缓慢。所以由志愿者在PIl的基础上创建了一个分支版本，命名为Pillow，Pillow目前最新支持到

Python3.6，更新活跃，并且增加了许多新的特性。所以在这里讲解一下Pillow库

安装

命令行pip安装

pip install Pillow

但是需要注意一点，Pillow和PIL是不能共存在一个环境中的，所以如果安装有PIL的话，需要先把PIL卸载掉，也不用担心更能问题，

Pillow具备PIL绝大多数的方法，卸载命令

pip uninstall PIL

由于是继承PIL的分支，所以Pillow的导入是这样的：

import PIL

#或者是

from PIL import Image

使用手册

Image

Image是Pillow中最为重要的类，实现了Pillow中大部分的功能。要创建这个类的示例主要有三个方法：

　　1. 从文件加载图片

　　2. 处理其他图像获得

　　3. 创建一个新的图像

读取图像

一般来说，我们都是通过文件加载图像来实例化这个类，如下所示：

from PIl import Image
picture = Image.open(\'test.png\')

如果没有指定图片格式的话，那么Pillow会自动识别文件内容为文件格式。

新建图像

Pillow新建空白图像使用new()方法，第一个参数是mode即颜色空间模式，第二个参数指定了五项的分辨率（宽x高），第三个参数是颜色。

- 可以直接填入常用的颜色的名称。如‘red\'。

- 也可以填入十六进制表示的颜色，如#F0000表示红色。

- 还能传入元组，比如（255，0，0，255）或者（255，0，0）表示红色。

picture = Image.new(\'RGB\', (200, 100), \'red\')

保存图片

保存图片的话需要使用save()方法：

picture.save(\'test.png\')

保存的时候，如果没有指定图片格式的话，那么Pillow会根据输入的后缀名决定保存的文件格式。

图像的坐标表示

- 在Pillow中，用的是图像左上角的坐标的原点(0，0).所以这意味着，x轴的数值是从左到右增长的，y轴的数值是从上到下增长的。

- 我们处理图像时，常常需要去表示一个矩形的图像区域。Pillow中很多的方法都需要传入一个表示矩形区域的元组参数。

- 这个元组参数包含四个值，分别代表矩形四条边的距离X轴或者Y轴的距离。顺序是(左，顶，右，底)。其实就相当于，

矩形的左上顶点坐标为(左，顶)，矩形的右下顶点坐标为(右，底)，两个顶点就可以确定一个矩形的位置。

- 右和底坐标稍微特殊，跟python列表索引规则一样，是左闭右开的。可以理解为[左, 右)和[顶，底)这样左闭右开的区间。

比如(3, 2, 8, 9)就表示了横坐标范围[3, 7]；纵坐标范围[2, 8]的矩形区域。

常用属性

PIL.Image.filename

打印图像源文件的文件名或者路径，只有使用open()方法创建的对象有这个属性。

类型：字符串
PIL.Image.format

图像源文件的文件格式。
PIL.Image.mode

图像的模式，一般来说是“1”, “L”, “RGB”, 或者“CMYK” 。
PIL.Image.size

图像的大小
PIL.Image.width

图像的宽度
PIL.Image.height

图像的高度
PIL.Image.info

图像的一些信息，为字典格式

常用方法

裁剪图片

Image使用crop()方法来裁剪图像，此方法需要传入一个矩形元祖参数，返回一个新的Image对象，对原图没有影响。

croped_im = img.crop((50, 60, 400, 218))

原图片：

裁剪以后：

复制与粘贴图像

复制图像使用copy()方法：

copyed_im = im.copy()

粘贴图像使用paste()方法：

croped_im = im.crop((50, 60, 400, 218))
im.paste(croped_im, (0, 0))

im对象调用了paste()方法，第一个参数是被裁剪下来用来粘贴的图像，第二个参数是一个位置参数元祖，这个位置参数是粘贴的图像的左顶点。

调整图像的大小

调整图像大小使用resize()方法：

resized_im = im.resize((width, height))

resize()方法会返回一个重设了大小的Image对象。

或者使用thumbnail（）方法：

im = Image.open(\'test.jpg\')
#获得图像尺寸
w, h = im.size  
# 缩放到50%
im.htumbnail((w//2, h//2))  
#显示图片
im.show()

thumbnail() 方法可以用来制作缩略图。它接受一个二元数组作为缩略图的尺寸，然后将示例缩小到指定尺寸

旋转图像和翻转图像

旋转图像使用rotate()方法，此方法按逆时针旋转，并返回一个新的Image对象：

# 逆时针旋转90度
im.rotate(90)
im.rotate(180)
im.rotate(20, expand=True)

inn = img.rotate(90)

旋转的时候，会将图片超出边界的边角裁剪掉。如果加入expand=True参数，就可以将图片边角保存住。

翻转图像使用transpose()：

# 水平翻转
im.transpose(Image.FLIP_LEFT_RIGHT)
# 垂直翻转
im.transpose(Image.FLIP_TOP_BOTTOM)

获得图片通道名称

im.getbands()

通过通道分割图片

split()

split()可以将多通道图片按通道分割为单通道图片。返回各个通道的灰度图组成的元组

R, G, B = im.split()

split()方法返回的是一个元祖，元祖中的元素则是分割后的单个通道的图片。

getchannel(channel)

getchannel()可以获取单个通道的图片：

R = im.getchannel("R")

模式转化

img = im.convert("L")

获取单个像素的值

使用getpixel(xy)方法可以获取单个像素位置的值：

im.getpixel((100, 100))

传入的xy需要是一个元祖形式的坐标。

如果图片是多通道的，那么返回的是一个元祖。

L模式经常用来处理图像识别，数据方便分析处理

加载图片全部数据

我们可以使用load()方法加载图片所有的数据，并比较方便的修改像素的值：

pixdata = im.load()
pixdata[100,200] = 255

此方法返回的是一个PIL.PyAccess，可以通过这个类的索引来对指定坐标的像素点进行修改。

获取全部像素内容

getdata(band = None) 方法，用来获取 Image 类的对象中的像素内容

该方法会将图片中的像素内容，逐行逐行地拼接起来，作为一个完整的序列返回。方法的返回类型，是 PIL 库的内部类型。我们可以用 list(im.getdata()) 得到标准的 Python list 对象。

band 意味「通道」。当 band = None 时，方法返回所有通道的像素内容；当 band = 0时，则返回第一个通道的像素内容。例如，对于 RGB 模式的位图，band = 0 返回 R 通道的内容；band = 2 返回 B 通道的内容。

from PIL import Image

im = Image.open(\'test.jpg\')
print(im.getdata())  #获取所有通道的值 类似生成器的对象
print(list(im.getdata(0)))  #获取第一个通道的值, 转化为列表

关闭图片并释放内存

此方法会删除图片对象并释放内存

im.close()

以上是关于Python图像处理-Pillow的主要内容，如果未能解决你的问题，请参考以下文章