Python:这有可能是最详细的PIL库基本概念文章了
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python:这有可能是最详细的PIL库基本概念文章了相关的知识,希望对你有一定的参考价值。
参考技术APIL有如下几个模块:Image模块、ImageChops模块、ImageCrackCode模块、ImageDraw模块、ImageEnhance模块、ImageFile模块、ImageFileIO模块、ImageFilter模块、ImageFont模块、ImageGrab模块、ImageOps模块、ImagePath模块、ImageSequence模块、ImageStat模块、ImageTk模块、ImageWin模块、PSDraw模块
啊啊啊啊怎么这么多模块啊~~~!!!!
别担心我为你一一讲解
Image模块提供了一个相同名称的类,即image类,用于表示PIL图像。
Image模块是PIL中最重要的模块 ,比如创建、打开、显示、保存图像等功能,合成、裁剪、滤波等功能,获取图像属性功能,如图像直方图、通道数等。
Image模块的使用如下:
ImageChops模块包含一些算术图形操作,这些操作可用于诸多目的,比如图像特效,图像组合,算法绘图等等,通道操作只用于8位图像。
ImageChops模块的使用如下:
由于图像im_dup是im的复制过来的,所以它们的差为0,图像im_diff显示时为黑图。
ImageCrackCode模块允许用户检测和测量图像的各种特性。 这个模块只存在于PIL Plus包中。
因为我目前安装的PIL中没有包含这个模块。所以就不详细介绍了
ImageDraw模块为image对象提供了基本的图形处理功能。 例如,它可以创建新图像,注释或润饰已存在图像,为web应用实时产生各种图形。
ImageDraw模块的使用如下:
在del draw前后显示出来的图像im是完全一样的,都是在原有图像上画了两条对角线。
原谅我的报错
ImageEnhance模块包括一些用于图像增强的类。它们分别为 Color类、Brightness类、Contrast类和Sharpness类。
ImageEnhance模块的使用如下:
图像im0的亮度为图像im的一半。
ImageFile模块为图像打开和保存功能提供了相关支持功能。另外,它提供了一个Parser类,这个类可以一块一块地对一张图像进行解码(例如,网络联接中接收一张图像)。这个类的接口与标准的sgmllib和xmllib模块的接口一样。
ImageFile模块的使用如下:
因为所打开图像大小大于1024个byte,所以报错:图像不完整。
所以大家想看的可以自行去找一个小一点的图看一下
ImageFileIO模块用于从一个socket或者其他流设备中读取一张图像。 不赞成使用这个模块。 在新的code中将使用ImageFile模块的Parser类来代替它。
ImageFilter模块包括各种滤波器的预定义集合,与Image类的filter方法一起使用。该模块包含这些图像增强的滤器:BLUR,CONTOUR,DETAIL,EDGE_ENHANCE,EDGE_ENHANCE_MORE,EMBOSS,FIND_EDGES,SMOOTH,SMOOTH_MORE和SHARPEN。
ImageFilter模块的使用如下:
ImageFont模块定义了一个同名的类,即ImageFont类。这个类的实例中存储着bitmap字体,需要与ImageDraw类的text方法一起使用。
PIL使用自己的字体文件格式存储bitmap字体。用户可以使用pilfont工具包将BDF和PCF字体描述器(Xwindow字体格式)转换为这种格式。
PIL Plus包中才会支持矢量字体。
ImageGrab模块用于将屏幕上的内容拷贝到一个PIL图像内存中。 当前的版本只在windows操作系统上可以工作。
ImageGrab模块的使用如下:
图像im显示出笔记本当前的窗口内容,就是类似于截图的工具
ImageOps模块包括一些“ready-made”图像处理操作。 它可以完成直方图均衡、裁剪、量化、镜像等操作 。大多数操作只工作在L和RGB图像上。
ImageOps模块的使用如下:
图像im_flip为图像im垂直方向的镜像。
ImagePath模块用于存储和操作二维向量数据。Path对象将被传递到ImageDraw模块的方法中。
ImagePath模块的使用如下:
ImageSequence模块包括一个wrapper类,它为图像序列中每一帧提供了迭代器。
ImageSequence模块的使用如下:
后面两次show()函数调用,分别显示第1张和第11张图像。
ImageStat模块计算一张图像或者一张图像的一个区域的全局统计值。
ImageStat模块的使用如下:
ImageTk模块用于创建和修改BitmapImage和PhotoImage对象中的Tkinter。
ImageTk模块的使用如下:
这个是我一直不太懂的有没有大佬能帮我解决一下在线等~急!
PSDraw模块为Postscript打印机提供基本的打印支持。用户可以通过这个模块打印字体,图形和图像。
PIL中所涉及的基本概念有如下几个: 通道(bands)、模式(mode)、尺寸(size)、坐标系统(coordinate system)、调色板(palette)、信息(info)和滤波器(filters)。
每张图片都是由一个或者多个数据通道构成。PIL允许在单张图片中合成相同维数和深度的多个通道。
以RGB图像为例,每张图片都是由三个数据通道构成,分别为R、G和B通道。而对于灰度图像,则只有一个通道。
对于一张图片的通道数量和名称,可以通过getbands()方法来获取。getbands()方法是Image模块的方法,它会返回一个字符串元组(tuple)。该元组将包括每一个通道的名称。
Python的元组与列表类似,不同之处在于元组的元素不能修改,元组使用小括号,列表使用方括号,元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。
getbands()方法的使用如下:
图像的模式定义了图像的类型和像素的位宽。当前支持如下模式:
1:1位像素,表示黑和白,但是存储的时候每个像素存储为8bit。
L:8位像素,表示黑和白。
P:8位像素,使用调色板映射到其他模式。
I:32位整型像素。
F:32位浮点型像素。
RGB:3x8位像素,为真彩色。
RGBA:4x8位像素,有透明通道的真彩色。
CMYK:4x8位像素,颜色分离。
YCbCr:3x8位像素,彩色视频格式。
PIL也支持一些特殊的模式,包括RGBX(有padding的真彩色)和RGBa(有自左乘alpha的真彩色)。
可以通过mode属性读取图像的模式。其返回值是包括上述模式的字符串。
mode 属性 的使用如下:
通过size属性可以获取图片的尺寸。这是一个二元组,包含水平和垂直方向上的像素数。
mode属性的使用如下:
PIL使用笛卡尔像素坐标系统,坐标(0,0)位于左上角。注意:坐标值表示像素的角;位于坐标(0,0)处的像素的中心实际上位于(0.5,0.5)。
坐标经常用于二元组(x,y)。长方形则表示为四元组,前面是左上角坐标。例如:一个覆盖800x600的像素图像的长方形表示为(0,0,800,600)。
调色板模式 ("P")使用一个颜色调色板为每个像素定义具体的颜色值
使用info属性可以为一张图片添加一些辅助信息。这个是字典对象。加载和保存图像文件时,多少信息需要处理取决于文件格式。
info属性的使用如下:
对于将多个输入像素映射为一个输出像素的几何操作,PIL提供了4个不同的采样滤波器:
NEAREST:最近滤波。 从输入图像中选取最近的像素作为输出像素。它忽略了所有其他的像素。
BILINEAR:双线性滤波。 在输入图像的2x2矩阵上进行线性插值。注意:PIL的当前版本,做下采样时该滤波器使用了固定输入模板。
BICUBIC:双立方滤波。 在输入图像的4x4矩阵上进行立方插值。注意:PIL的当前版本,做下采样时该滤波器使用了固定输入模板。
ANTIALIAS:平滑滤波。 这是PIL 1.1.3版本中新的滤波器。对所有可以影响输出像素的输入像素进行高质量的重采样滤波,以计算输出像素值。在当前的PIL版本中,这个滤波器只用于改变尺寸和缩略图方法。
注意:在当前的PIL版本中,ANTIALIAS滤波器是下采样 (例如,将一个大的图像转换为小图) 时唯一正确的滤波器。 BILIEAR和BICUBIC滤波器使用固定的输入模板 ,用于固定比例的几何变换和上采样是最好的。Image模块中的方法resize()和thumbnail()用到了滤波器。
resize()方法的定义为:resize(size, filter=None)=> image
resize()方法的使用如下:
对参数filter不赋值的话,resize()方法默认使用NEAREST滤波器。如果要使用其他滤波器可以通过下面的方法来实现:
thumbnail ()方法的定义为:im.thumbnail(size, filter=None)
thumbnail ()方法的使用如下:
这里需要说明的是,方法thumbnail()需要保持宽高比,对于size=(200,200)的输入参数,其最终的缩略图尺寸为(182, 200)。
对参数filter不赋值的话,方法thumbnail()默认使用NEAREST滤波器。如果要使用其他滤波器可以通过下面的方法来实现:
第96天:图像库 PIL
by 闲欢
Python 提供了 PIL(python image library)图像库,来满足开发者处理图像的功能,该库提供了广泛的文件格式支持,包括常见的 JPEG、PNG、GIF 等,它提供了图像创建、图像显示、图像处理等功能。
基本概念
要学习 PIL 图像库的使用,我们必须先来了解一些关于图像的基本概念,包括深度(depth),通道(bands),模式(mode),坐标系统(coordinate system)等。
图像的深度
图像中像素点占得 bit 位数,就是图像的深度,比如:
二值图像:图像的像素点不是0就是1 (图像不是黑色就是白色),图像像素点占的位数就是1位,图像的深度就是1,也称作位图。
灰度图像:图像的像素点位于0-255之间(0代表全黑,255代表全白,在0-255之间插入了255个等级的灰度)。2^8=255,图像像素点占的位数就是8位,图像的深度是8。
依次类推,我们把计算机中存储单个像素点所用的 bit 位称为图像的深度。
图像的通道
每张图像都是有一个或者多个数据通道构成的,如 RGB 是基本的三原色(红色、绿色和蓝色),如果我们用8位代表一种颜色,那么每种颜色的最大值是255,这样,每个像素点的颜色值范围就是(0-255, 0-255, 0-255)。这样的图像的通道就是3。而灰度图像的通道数是1。
图像的模式
图像实际上是像素数据的矩形图,图像的模式定义了图像中像素的类型和深度,每种类型代表不同的深度,在 PIL 中我们称之为图像的模式。常见的模式有以下几种:
1:1位像素,表示黑和白,占8 bit ,在图像表示中称为位图。
L:表示黑白之间的灰度,占8 bit 像素。
P:8位像素,使用调色版映射。
RGB:真彩色,占用 3x8 位像素,其中 R 为红色,G 为绿色,B为蓝色,三原色叠加形成的色彩变化,如三通道都为0则代表黑色,都为255则代表白色。
RGBA:为带透明蒙版的真彩色,其中的 A 为 alpha 透明度,占用 4x8 位像素
其他的还有 CMYK、 YCbCr、I、F等不常用的模式,这里就不多做介绍了。
图像的坐标系
PIL 中图像的坐标是从左上角开始,向右下角延伸,以二元组 (x,y)的形式传递,x 轴从左到右,y 轴从上到下,即左上角的坐标为 (0, 0)。那么矩形用四元组表示就行,例如一个450 x 450 像素的矩形图像可以表示为 (0, 0, 450, 450)。
PIL 的安装
和其他库一样,PIL 的安装也很简单:
pip3 install pillow
PIL 图像模块的功能
打开图像
我们可以从本地目录中打开文件,也可以从文件流中打开图像。打开文件的方法为:
Image.open(file,mode)
读取图像文件,mode 只能是 ‘r’,所以我们也可以省略这个参数。
from PIL import Image
from io import BytesIO
import requests
# 打开图像文件
im = Image.open(‘cat.jpg‘)
# 从文件流中打开图像
r = requests.get(‘http://f.hiphotos.baidu.com/image/pic/item/b151f8198618367aa7f3cc7424738bd4b31ce525.jpg‘)
im2 = Image.open(BytesIO(r.content))
# 展示图像
im.show()
im2.show()
# 翻转90度展示
im.rotate(90).show()
我们首先打开本目录下的 cat.jpg 图像,接着从百度图片请求到一张图片,使用文件流的方式打开。使用 show 方法可以展示图像。我们也可以使用 rotate 方法来是图像翻转角度。运行程序,我们会看到弹出三张图片,一张是 cat.jpg 对应的图像,一张是百度图片中的图像,还有一种是将 cat.jpg 翻转90度后展示的图像。
创建图像
Image.new(mode,size,color)
我们可以使用给定的模式、大小和颜色来创建新图像。大小以(宽度,高度)的二元组形式给出,单位为像素;颜色以单波段图像的单个值和多波段图像的元组(每个波段的一个值)给出,可以使用颜色名如 ‘red’ ,也可以受用16进制 ‘#FF0000‘ 或者使用数字表示(255,0,0)。
from PIL import Image
im = Image.new(‘RGB‘, (450, 450), (255, 0, 0))
im1 = Image.new(‘RGB‘, (450, 450), ‘red‘)
im2 = Image.new(‘RGB‘, (450, 450), ‘#FF0000‘)
im.show()
im1.show()
im2.show()
上面例子中我们分别通过三种形式创建了 RGB 模式的大小为 450x450 ,颜色为红色的图像,最终的图像效果是一样的。
转换格式
Image.save(file)
我们直接使用保存方法,修改保存的文件名就可以转换图像的格式。
from PIL import Image
# 加载 cat.jpg
im = Image.open(‘cat.jpg‘, ‘r‘)
# 打印图片类型
print(im.format)
# 保存为 png 类型图片
im.save(‘cat.png‘)
# 加载新保存的 png 类型图片
im2 = Image.open(‘cat.png‘, ‘r‘)
# 打印新保存图片类型
print(im2.format)
# 输出结果
JPEG
PNG
例子中我们先打开 cat.jpg 图像,然后新保存一张类型为 png 的图像,通过打印我们可以看到两者的格式。
创建缩略图
Image.thumbnail(size, resample=3)
修改当前图像制作成缩略图,该缩略图尺寸不大于给定的尺寸。这个方法会计算一个合适的缩略图尺寸,使其符合当前图像的宽高比,调用方法 draft() 配置文件读取器,最后改变图像的尺寸。
size 参数表示给定的最终缩略图大小。
resample 参数是过滤器,只能是 NEAREST、BILINEAR、BICUBIC 或者 ANTIALIAS 之一。如果省略该变量,则默认为 NEAREST。
注意:在当前PIL的版本中,滤波器 BILINEAR 和 BICUBIC 不能很好地适应缩略图产生。用户应该使 用ANTIALIAS,图像质量最好。如果处理速度比图像质量更重要,可以选用其他滤波器。这个方法在原图上进行修改。
from PIL import Image
# 加载图像
im = Image.open(‘cat.png‘)
# 展示图像
im.show()
# 图像尺寸
size = 128, 128
# 缩放图像
im.thumbnail(size, Image.ANTIALIAS)
# 展示图像
im.show()
我们将一个 450x450 大小的图像缩放成了 128x128 大小的图像,程序运行的结果如下图:
融合图像
Image.blend(image1, image2, alpha)
将图像 image1 和 图像 im2 根据 alpha 值进行融合,公式为:
out = image1 * (1.0 - alpha) + image2 * alpha
image1 和 image2 表示两个大小和模式相同的图像, alpha 是介于 0 和 1 之间的值。如果 alpha 为0,返回 image1 图像,如果 alpha 为1,返回 image2 图像。
from PIL import Image
# 蓝色图像
image1 = Image.new(‘RGB‘, (128, 128), (0, 0, 255))
# 红色图像
image2=Image.new(‘RGB‘, (128, 128), (255, 0, 0))
# 取中间值
im = Image.blend(image1, image2, 0.5)
image1.show()
image2.show()
# 显示紫色图像
im.show()
我们将一张蓝色图像和一张红色图像进行融合,融合度为两张图像各0.5,最终得到一张紫色图像(因为红色叠加蓝色会调和成紫色)。显示图像如下图:
像素点处理
Image.eval(image, *args)
根据传入的函数对图像每个像素点进行处理。第一个参数 image 为需要处理的图像对象,第二个参数是函数对象,有一个整数作为参数。
如果变量image所代表图像有多个通道,那么函数作用于每一个通道。注意:函数对每个像素点只处理一次,所以不能使用随机组件和其他生成器。
from PIL import Image
im = Image.open(‘cat.jpg‘)
im.show()
# 将每个像素值翻倍(相当于亮度翻倍)
evl1 = Image.eval(im, lambda x: x*2)
evl1.show()
# 将每个像素值减半(相当于亮度减半)
evl2 = Image.eval(im, lambda x: x/2)
evl2.show()
我们分别对图像进行像素值翻倍和减半处理,显示效果如下图:
合成图像
Image.composite(image1, image2, mask)
使用给定的两张图像及 mask 图像作为透明度,创建出一张新的图像。变量 mask 图像的模式可以为“1”,“L” 或者 “RGBA”。所有图像必须有相同的尺寸。
from PIL import Image
# 打开 cat.png
image1 = Image.open(‘cat.png‘)
# 打开 flower.jpg
image2 = Image.open(‘flower.jpg‘)
# 分离image1的通道
r, g, b = image1.split()
# 合成图像,获得 cat + flower
im = Image.composite(image1, image2, mask=b)
image1.show()
image2.show()
im.show()
上面例子中我们将一张图像猫(cat.png)和一张图像花(flower.jpg),以图像猫的一个通道构成的蒙版进行合成,就像 PS 一样,我们最终得到猫+花的图像,结果如下图所示:
通过单通道创建图像
Image.merge(mode,bands)
将一组单通道图像合并成多通道图像。参数 mode 为输出图像的模式,bands 为输出图像中每个通道的序列。
from PIL import Image
im = Image.open(‘cat.png‘)
# 将三个通道分开
im_split = im.split()
# 分别显示三个单通道图像
im_split[0].show()
im_split[1].show()
im_split[2].show()
# 将三个通道再次合并
im2 = Image.merge(‘RGB‘, im_split)
im2.show()
# 打开第二张图像
im3 = Image.open(‘flower.jpg‘)
# 将第二张图像的三个通道分开
im_split2 = im3.split()
# 将第二张图像的第1个通道和第一张图像的第2、3通道合成一张图像
rgbs = [im_split2[0], im_split[1], im_split[2]]
im4 = Image.merge(‘RGB‘, rgbs)
im4.show()
上面例子中,我们先将 cat.jpg 图像的三个通道分离成三张图像,效果如下图:
然后我们又将 flower.jpg 图像的三个通道分离,最后分别取 flower.jpg 的 R 通道图像和 cat.jpg 的 G 和 B 通道图像合成一张新图像,最终的效果如下图:
总结
本节为大家介绍了 Python pillow 库中图像有关的几个基本概念,以及 PIL 模块中处理图像的几个常见功能。掌握了这些功能后,我们可以打开、创建图像,也可以对图像做一些常见的如拆分、合成、融合等操作,这些都是图像处理的基础,需要大家好好理解和掌握。
文中示例代码:python-100-days
参考资料
https://www.osgeo.cn/pillow/reference/
关注公众号:python技术,回复"python"一起学习交流
以上是关于Python:这有可能是最详细的PIL库基本概念文章了的主要内容,如果未能解决你的问题,请参考以下文章