Python：这有可能是最详细的PIL库基本概念文章了

Posted 2023-05-08

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python：这有可能是最详细的PIL库基本概念文章了相关的知识，希望对你有一定的参考价值。

参考技术A

PIL有如下几个模块：Image模块、ImageChops模块、ImageCrackCode模块、ImageDraw模块、ImageEnhance模块、ImageFile模块、ImageFileIO模块、ImageFilter模块、ImageFont模块、ImageGrab模块、ImageOps模块、ImagePath模块、ImageSequence模块、ImageStat模块、ImageTk模块、ImageWin模块、PSDraw模块

啊啊啊啊怎么这么多模块啊~~~！！！！

别担心我为你一一讲解

Image模块提供了一个相同名称的类，即image类，用于表示PIL图像。

Image模块是PIL中最重要的模块 ，比如创建、打开、显示、保存图像等功能，合成、裁剪、滤波等功能，获取图像属性功能，如图像直方图、通道数等。

Image模块的使用如下：

ImageChops模块包含一些算术图形操作，这些操作可用于诸多目的，比如图像特效，图像组合，算法绘图等等，通道操作只用于8位图像。

ImageChops模块的使用如下：

由于图像im_dup是im的复制过来的，所以它们的差为0，图像im_diff显示时为黑图。

ImageCrackCode模块允许用户检测和测量图像的各种特性。 这个模块只存在于PIL Plus包中。

因为我目前安装的PIL中没有包含这个模块。所以就不详细介绍了

ImageDraw模块为image对象提供了基本的图形处理功能。 例如，它可以创建新图像，注释或润饰已存在图像，为web应用实时产生各种图形。

ImageDraw模块的使用如下：

在del draw前后显示出来的图像im是完全一样的，都是在原有图像上画了两条对角线。

原谅我的报错

ImageEnhance模块包括一些用于图像增强的类。它们分别为 Color类、Brightness类、Contrast类和Sharpness类。

ImageEnhance模块的使用如下：

图像im0的亮度为图像im的一半。

ImageFile模块为图像打开和保存功能提供了相关支持功能。另外，它提供了一个Parser类，这个类可以一块一块地对一张图像进行解码（例如，网络联接中接收一张图像）。这个类的接口与标准的sgmllib和xmllib模块的接口一样。

ImageFile模块的使用如下：

因为所打开图像大小大于1024个byte，所以报错：图像不完整。

所以大家想看的可以自行去找一个小一点的图看一下

ImageFileIO模块用于从一个socket或者其他流设备中读取一张图像。 不赞成使用这个模块。 在新的code中将使用ImageFile模块的Parser类来代替它。

ImageFilter模块包括各种滤波器的预定义集合，与Image类的filter方法一起使用。该模块包含这些图像增强的滤器：BLUR，CONTOUR，DETAIL，EDGE_ENHANCE，EDGE_ENHANCE_MORE，EMBOSS，FIND_EDGES，SMOOTH，SMOOTH_MORE和SHARPEN。

ImageFilter模块的使用如下：

ImageFont模块定义了一个同名的类，即ImageFont类。这个类的实例中存储着bitmap字体，需要与ImageDraw类的text方法一起使用。

PIL使用自己的字体文件格式存储bitmap字体。用户可以使用pilfont工具包将BDF和PCF字体描述器（Xwindow字体格式）转换为这种格式。

PIL Plus包中才会支持矢量字体。

ImageGrab模块用于将屏幕上的内容拷贝到一个PIL图像内存中。 当前的版本只在windows操作系统上可以工作。

ImageGrab模块的使用如下：

图像im显示出笔记本当前的窗口内容，就是类似于截图的工具

ImageOps模块包括一些“ready-made”图像处理操作。 它可以完成直方图均衡、裁剪、量化、镜像等操作 。大多数操作只工作在L和RGB图像上。

ImageOps模块的使用如下：

图像im_flip为图像im垂直方向的镜像。

ImagePath模块用于存储和操作二维向量数据。Path对象将被传递到ImageDraw模块的方法中。

ImagePath模块的使用如下：

ImageSequence模块包括一个wrapper类，它为图像序列中每一帧提供了迭代器。

ImageSequence模块的使用如下：

后面两次show()函数调用，分别显示第1张和第11张图像。

ImageStat模块计算一张图像或者一张图像的一个区域的全局统计值。

ImageStat模块的使用如下：

ImageTk模块用于创建和修改BitmapImage和PhotoImage对象中的Tkinter。

ImageTk模块的使用如下：

这个是我一直不太懂的有没有大佬能帮我解决一下在线等~急！

PSDraw模块为Postscript打印机提供基本的打印支持。用户可以通过这个模块打印字体，图形和图像。

PIL中所涉及的基本概念有如下几个： 通道（bands）、模式（mode）、尺寸（size）、坐标系统（coordinate system）、调色板（palette）、信息（info）和滤波器（filters）。

每张图片都是由一个或者多个数据通道构成。PIL允许在单张图片中合成相同维数和深度的多个通道。

以RGB图像为例，每张图片都是由三个数据通道构成，分别为R、G和B通道。而对于灰度图像，则只有一个通道。

对于一张图片的通道数量和名称，可以通过getbands()方法来获取。getbands()方法是Image模块的方法，它会返回一个字符串元组（tuple）。该元组将包括每一个通道的名称。

Python的元组与列表类似，不同之处在于元组的元素不能修改,元组使用小括号，列表使用方括号，元组创建很简单，只需要在括号中添加元素，并使用逗号隔开即可。

getbands()方法的使用如下：

图像的模式定义了图像的类型和像素的位宽。当前支持如下模式：

1：1位像素，表示黑和白，但是存储的时候每个像素存储为8bit。

L：8位像素，表示黑和白。

P：8位像素，使用调色板映射到其他模式。

I：32位整型像素。

F：32位浮点型像素。

RGB：3x8位像素，为真彩色。

RGBA：4x8位像素，有透明通道的真彩色。

CMYK：4x8位像素，颜色分离。

YCbCr：3x8位像素，彩色视频格式。

PIL也支持一些特殊的模式，包括RGBX（有padding的真彩色）和RGBa（有自左乘alpha的真彩色）。

可以通过mode属性读取图像的模式。其返回值是包括上述模式的字符串。

mode 属性 的使用如下：

通过size属性可以获取图片的尺寸。这是一个二元组，包含水平和垂直方向上的像素数。

mode属性的使用如下：

PIL使用笛卡尔像素坐标系统，坐标(0，0)位于左上角。注意：坐标值表示像素的角；位于坐标（0，0）处的像素的中心实际上位于（0.5，0.5）。

坐标经常用于二元组（x，y）。长方形则表示为四元组，前面是左上角坐标。例如：一个覆盖800x600的像素图像的长方形表示为（0，0，800，600）。

调色板模式 ("P")使用一个颜色调色板为每个像素定义具体的颜色值

使用info属性可以为一张图片添加一些辅助信息。这个是字典对象。加载和保存图像文件时，多少信息需要处理取决于文件格式。

info属性的使用如下：

对于将多个输入像素映射为一个输出像素的几何操作，PIL提供了4个不同的采样滤波器：

NEAREST：最近滤波。 从输入图像中选取最近的像素作为输出像素。它忽略了所有其他的像素。

BILINEAR：双线性滤波。 在输入图像的2x2矩阵上进行线性插值。注意：PIL的当前版本，做下采样时该滤波器使用了固定输入模板。

BICUBIC：双立方滤波。 在输入图像的4x4矩阵上进行立方插值。注意：PIL的当前版本，做下采样时该滤波器使用了固定输入模板。

ANTIALIAS：平滑滤波。 这是PIL 1.1.3版本中新的滤波器。对所有可以影响输出像素的输入像素进行高质量的重采样滤波，以计算输出像素值。在当前的PIL版本中，这个滤波器只用于改变尺寸和缩略图方法。

注意：在当前的PIL版本中，ANTIALIAS滤波器是下采样 （例如，将一个大的图像转换为小图） 时唯一正确的滤波器。 BILIEAR和BICUBIC滤波器使用固定的输入模板 ，用于固定比例的几何变换和上采样是最好的。Image模块中的方法resize()和thumbnail()用到了滤波器。

resize()方法的定义为：resize(size, filter=None)=> image

resize()方法的使用如下：

对参数filter不赋值的话，resize()方法默认使用NEAREST滤波器。如果要使用其他滤波器可以通过下面的方法来实现：

thumbnail ()方法的定义为：im.thumbnail(size, filter=None)

thumbnail ()方法的使用如下：

这里需要说明的是，方法thumbnail()需要保持宽高比，对于size=(200,200)的输入参数，其最终的缩略图尺寸为(182， 200)。

对参数filter不赋值的话，方法thumbnail()默认使用NEAREST滤波器。如果要使用其他滤波器可以通过下面的方法来实现：

第96天：图像库 PIL

by 闲欢

Python 提供了 PIL（python image library）图像库，来满足开发者处理图像的功能，该库提供了广泛的文件格式支持，包括常见的 JPEG、PNG、GIF 等，它提供了图像创建、图像显示、图像处理等功能。

基本概念

要学习 PIL 图像库的使用，我们必须先来了解一些关于图像的基本概念，包括深度（depth），通道（bands），模式（mode），坐标系统（coordinate system）等。

图像的深度

图像中像素点占得 bit 位数，就是图像的深度，比如：

二值图像：图像的像素点不是0就是1 （图像不是黑色就是白色），图像像素点占的位数就是1位，图像的深度就是1，也称作位图。

灰度图像：图像的像素点位于0-255之间（0代表全黑，255代表全白，在0-255之间插入了255个等级的灰度）。2^8=255，图像像素点占的位数就是8位，图像的深度是8。

依次类推，我们把计算机中存储单个像素点所用的 bit 位称为图像的深度。

图像的通道

每张图像都是有一个或者多个数据通道构成的，如 RGB 是基本的三原色（红色、绿色和蓝色），如果我们用8位代表一种颜色，那么每种颜色的最大值是255，这样，每个像素点的颜色值范围就是（0-255, 0-255, 0-255）。这样的图像的通道就是3。而灰度图像的通道数是1。

图像的模式

图像实际上是像素数据的矩形图，图像的模式定义了图像中像素的类型和深度，每种类型代表不同的深度，在 PIL 中我们称之为图像的模式。常见的模式有以下几种：

1：1位像素，表示黑和白，占8 bit ，在图像表示中称为位图。

L：表示黑白之间的灰度，占8 bit 像素。

P：8位像素，使用调色版映射。

RGB：真彩色，占用 3x8 位像素，其中 R 为红色，G 为绿色，B为蓝色，三原色叠加形成的色彩变化，如三通道都为0则代表黑色，都为255则代表白色。

RGBA：为带透明蒙版的真彩色，其中的 A 为 alpha 透明度，占用 4x8 位像素

其他的还有 CMYK、 YCbCr、I、F等不常用的模式，这里就不多做介绍了。

图像的坐标系

PIL 中图像的坐标是从左上角开始，向右下角延伸，以二元组（x，y）的形式传递，x 轴从左到右，y 轴从上到下，即左上角的坐标为 (0, 0)。那么矩形用四元组表示就行，例如一个450 x 450 像素的矩形图像可以表示为 (0, 0, 450, 450)。

PIL 的安装

和其他库一样，PIL 的安装也很简单：

pip3 install pillow

PIL 图像模块的功能

打开图像

我们可以从本地目录中打开文件，也可以从文件流中打开图像。打开文件的方法为：

Image.open(file,mode)

读取图像文件，mode 只能是 ‘r’，所以我们也可以省略这个参数。

from PIL import Image
from io import BytesIO
import requests

# 打开图像文件
im = Image.open(‘cat.jpg‘)

# 从文件流中打开图像
r = requests.get(‘http://f.hiphotos.baidu.com/image/pic/item/b151f8198618367aa7f3cc7424738bd4b31ce525.jpg‘)
im2 = Image.open(BytesIO(r.content))

# 展示图像
im.show()
im2.show()

# 翻转90度展示
im.rotate(90).show()

我们首先打开本目录下的 cat.jpg 图像，接着从百度图片请求到一张图片，使用文件流的方式打开。使用 show 方法可以展示图像。我们也可以使用 rotate 方法来是图像翻转角度。运行程序，我们会看到弹出三张图片，一张是 cat.jpg 对应的图像，一张是百度图片中的图像，还有一种是将 cat.jpg 翻转90度后展示的图像。

创建图像

Image.new(mode,size,color)

我们可以使用给定的模式、大小和颜色来创建新图像。大小以（宽度，高度）的二元组形式给出，单位为像素；颜色以单波段图像的单个值和多波段图像的元组（每个波段的一个值）给出，可以使用颜色名如 ‘red’ ，也可以受用16进制 ‘#FF0000‘ 或者使用数字表示（255,0,0）。

from PIL import Image

im = Image.new(‘RGB‘, (450, 450), (255, 0, 0))
im1 = Image.new(‘RGB‘, (450, 450), ‘red‘)
im2 = Image.new(‘RGB‘, (450, 450), ‘#FF0000‘)
im.show()
im1.show()
im2.show()

上面例子中我们分别通过三种形式创建了 RGB 模式的大小为 450x450 ，颜色为红色的图像，最终的图像效果是一样的。

转换格式

Image.save(file)

我们直接使用保存方法，修改保存的文件名就可以转换图像的格式。

from PIL import Image

# 加载 cat.jpg
im = Image.open(‘cat.jpg‘, ‘r‘)

# 打印图片类型
print(im.format)

# 保存为 png 类型图片
im.save(‘cat.png‘)

# 加载新保存的 png 类型图片
im2 = Image.open(‘cat.png‘, ‘r‘)

# 打印新保存图片类型
print(im2.format)


# 输出结果
JPEG
PNG

例子中我们先打开 cat.jpg 图像，然后新保存一张类型为 png 的图像，通过打印我们可以看到两者的格式。

创建缩略图

Image.thumbnail(size, resample=3)

修改当前图像制作成缩略图，该缩略图尺寸不大于给定的尺寸。这个方法会计算一个合适的缩略图尺寸，使其符合当前图像的宽高比，调用方法 draft() 配置文件读取器，最后改变图像的尺寸。

size 参数表示给定的最终缩略图大小。

resample 参数是过滤器，只能是 NEAREST、BILINEAR、BICUBIC 或者 ANTIALIAS 之一。如果省略该变量，则默认为 NEAREST。

注意：在当前PIL的版本中，滤波器 BILINEAR 和 BICUBIC 不能很好地适应缩略图产生。用户应该使用ANTIALIAS，图像质量最好。如果处理速度比图像质量更重要，可以选用其他滤波器。这个方法在原图上进行修改。

from PIL import Image

# 加载图像
im = Image.open(‘cat.png‘)

# 展示图像
im.show()

# 图像尺寸
size = 128, 128
# 缩放图像
im.thumbnail(size, Image.ANTIALIAS)

# 展示图像
im.show()

我们将一个 450x450 大小的图像缩放成了 128x128 大小的图像，程序运行的结果如下图：

融合图像

Image.blend(image1, image2, alpha)

将图像 image1 和图像 im2 根据 alpha 值进行融合，公式为：

out = image1 * (1.0 - alpha) + image2 * alpha

image1 和 image2 表示两个大小和模式相同的图像， alpha 是介于 0 和 1 之间的值。如果 alpha 为0，返回 image1 图像，如果 alpha 为1，返回 image2 图像。

from PIL import Image

# 蓝色图像
image1 = Image.new(‘RGB‘, (128, 128), (0, 0, 255))
# 红色图像
image2=Image.new(‘RGB‘, (128, 128), (255, 0, 0))
# 取中间值
im = Image.blend(image1, image2, 0.5)
image1.show()
image2.show()
# 显示紫色图像
im.show()

我们将一张蓝色图像和一张红色图像进行融合，融合度为两张图像各0.5，最终得到一张紫色图像（因为红色叠加蓝色会调和成紫色）。显示图像如下图：

技术图片

像素点处理

Image.eval(image, *args)

根据传入的函数对图像每个像素点进行处理。第一个参数 image 为需要处理的图像对象，第二个参数是函数对象，有一个整数作为参数。

如果变量image所代表图像有多个通道，那么函数作用于每一个通道。注意：函数对每个像素点只处理一次，所以不能使用随机组件和其他生成器。

from PIL import Image

im = Image.open(‘cat.jpg‘)
im.show()

# 将每个像素值翻倍（相当于亮度翻倍）
evl1 = Image.eval(im, lambda x: x*2)
evl1.show()

# 将每个像素值减半（相当于亮度减半）
evl2 = Image.eval(im, lambda x: x/2)
evl2.show()

我们分别对图像进行像素值翻倍和减半处理，显示效果如下图：

技术图片

合成图像

Image.composite(image1, image2, mask)

使用给定的两张图像及 mask 图像作为透明度，创建出一张新的图像。变量 mask 图像的模式可以为“1”，“L” 或者 “RGBA”。所有图像必须有相同的尺寸。

from PIL import Image

# 打开 cat.png
image1 = Image.open(‘cat.png‘)

# 打开 flower.jpg
image2 = Image.open(‘flower.jpg‘)

# 分离image1的通道
r, g, b = image1.split()

# 合成图像，获得 cat + flower
im = Image.composite(image1, image2, mask=b)

image1.show()
image2.show()
im.show()

上面例子中我们将一张图像猫（cat.png）和一张图像花（flower.jpg），以图像猫的一个通道构成的蒙版进行合成，就像 PS 一样，我们最终得到猫+花的图像，结果如下图所示：

技术图片

通过单通道创建图像

Image.merge(mode,bands)

将一组单通道图像合并成多通道图像。参数 mode 为输出图像的模式，bands 为输出图像中每个通道的序列。

from PIL import Image

im = Image.open(‘cat.png‘)
# 将三个通道分开
im_split = im.split()

# 分别显示三个单通道图像
im_split[0].show()
im_split[1].show()
im_split[2].show()

# 将三个通道再次合并
im2 = Image.merge(‘RGB‘, im_split)
im2.show()

# 打开第二张图像
im3 = Image.open(‘flower.jpg‘)
# 将第二张图像的三个通道分开
im_split2 = im3.split()

# 将第二张图像的第1个通道和第一张图像的第2、3通道合成一张图像
rgbs = [im_split2[0], im_split[1], im_split[2]]
im4 = Image.merge(‘RGB‘, rgbs)
im4.show()

上面例子中，我们先将 cat.jpg 图像的三个通道分离成三张图像，效果如下图：

技术图片