常见图像增强(python 实现)

Posted JiYH

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了常见图像增强(python 实现)相关的知识,希望对你有一定的参考价值。

反色变换

推荐B站UP,十四阿哥很nice
几节图像处理课讲的很清楚。
用于增强暗背景下的图像,使人眼能够观看到更多细节。
假设原始图像的灰度范围是[0,L],L表示该图像最大的灰度值,则反色变换为output = L - input

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

# 1,反色变换
# 假设原始图像的灰度范围是[0,L],L表示该图像最大的灰度值
# 则反色变换为output = L - input

def image_inverse(input):
    value_max = np.max(input)
    output = value_max - input
    return output

gray_img = np.asarray(Image.open('X.jpg').convert('L'))
inv_img = image_inverse(gray_img)

plt.subplot(121)
plt.title('original')
plt.imshow(gray_img, cmap='gray', vmin=0, vmax=255)

plt.subplot(122)
plt.title('inverse')
plt.imshow(inv_img, cmap='gray', vmin=0, vmax=255)
plt.show()

对数变换

对数变换,目的是压缩图像矩阵值域的动态范围,让我们可以看到更多细节
假设原始图像灰度取值范围是[x1,x2], (x1>=x2>=0)
则对数变换为 output = log(1 + input)
log输入为0时输出为负无穷,+1就是为了避免此情况(或者理解为偏置)

imshow绘图时,若不指定vmin,vmax,默认输入最小值为vmin对应0,vmax对应255

def set_Chinese():
    import  matplotlib
    matplotlib.rcParams['font.sans-serif'] = ['SimHei']
    matplotlib.rcParams['axes.unicode_minus'] = False

def image_log(input):
    return np.log(1 + input)

set_Chinese() # 解决中文乱码问题
input = np.array([[10, 150],
                  [250, 25500]])
output = image_log(input)
fig = plt.figure()
ax1 = fig.add_subplot(121)
ax1.set_title('对数变换前', fontsize=12)
ax1.imshow(input, cmap='gray', vmin=0, vmax=25500)

ax2 = fig.add_subplot(122)
ax2.set_title('对数变换后', fontsize=12)
ax2.imshow(output, cmap='gray')
plt.show()

伽马变换

又称幂律变换,因为使用幂函数来操作输入图像,表达式

  • gamma次幂称为伽马系数,在伽马变换中规定这个数必须为正数
  • eps 称为补偿系数,默认0(如果没有eps,当input中有为0时,对该像素的伽马变换就失效了,0的任意次幂都为0)

但幂运算又导致图像输出动态范围过大,引入归一化(8bit像素):

def gamma_trans(input, gamma=2, eps=0):
    return 255.*(((input + eps) / 255.) ** gamma)


def update_gamma(val):
    gamma = slider1.val
    output = gamma_trans(input_arr, gamma=gamma, eps=0.5)
    print('------------\\n', output)
    ax1.set_title('伽马变换后,gamma = ' + str(gamma))
    ax1.imshow(output, cmap='gray', vmin=0, vmax=255)


set_Chinese()
input_arr = np.array([[0, 50, 100, 150],
                    [0, 50, 100, 150],
                    [0, 50, 100, 150],
                    [0, 50, 100, 150]])

fig = plt.figure()
ax0 = fig.add_subplot(121)
ax0.set_title('输入矩阵')
ax0.imshow(input_arr, cmap='gray', vmin=0, vmax=255)

ax1 = fig.add_subplot(122)

plt.subplots_adjust(bottom=0.3)  # 划分一块滑动条,从底部向上30%
# 设置属性和颜色
s1 = plt.axes([0.25, 0.1, 0.55, 0.03], facecolor='lightgoldenrodyellow')
# 创建滑动条,范围0-2,初始为1,步长0.1
slider1 = Slider(s1, '参数gamma', 0.0, 2.0, valfmt='%.f', valinit=1.0, valstep=0.1)
slider1.on_changed(update_gamma)
plt.show()


肉眼观测的话gamma(>1)越大图像越黑,gamma(<1)越小图像越亮。
应用:

  • 矫正显示失真

CRT显示器的物理特性导致送入显示器的灰度值并非线性输出,而是以幂函数的形式非线性输出。不同厂家的幂不一样,一般介于1.8-2.5所以我们先对输入做伽马变换,gamma = 1 /(厂家的幂)处理,保证线性输出。

'''
【功能】利用γ变换提前矫正图像,从而实现图像在CRT显示器中正常显示
【B站/YouTube】轩辕十四很nice
【开源协议】The MIT License (MIT)
'''


from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.widgets import Slider, Button, RadioButtons


def set_chinese():   # 中文显示工具函数
	import matplotlib
	print("[INFO] matplotlib版本为:%s" % matplotlib.__version__)
	matplotlib.rcParams['font.sans-serif'] = ['FangSong']
	matplotlib.rcParams['axes.unicode_minus'] = False

def gamma_trans(input, gamma=2, eps=0 ):
    return 255. * (((input + eps)/255.) ** gamma)

def crt_distortion(input, gamma=2):  # 模拟CRT失真(做了归一化)
    return 255. * ((input/255.) ** gamma)


def update_gamma(val):

    gamma = slider1.val  # 获取"失真γ"


    # 图像送入CRT前,先做伽马变换预处理
    gamma_ = 1 / gamma   #  "矫正γ" 为 "失真γ" 的倒数
    correct_img = gamma_trans(gray_img, gamma_, 0)  #
    ax1.set_title("伽马矫正,矫正γ = 1/" + str(round(gamma,2)))
    ax1.imshow(correct_img, cmap='gray',vmin=0,vmax=255)

    # 简易模拟CRT输出
    output = crt_distortion(correct_img, gamma)
    print(output)
    ax2.set_title("模拟CRT输出,失真γ = " + str(round(gamma,2)))
    ax2.imshow(output, cmap='gray',vmin=0,vmax=255)


if __name__ == '__main__':
    set_chinese()

    gray_img = np.asarray(Image.open('./intensity_ramp.tif').convert('L'))

    fig = plt.figure()
    ax0 = fig.add_subplot(131)
    ax1 = fig.add_subplot(132)
    ax2 = fig.add_subplot(133)


    ax0.set_title("原始图片")
    ax0.imshow(gray_img, cmap='gray',vmin=0,vmax=255)


    plt.subplots_adjust(bottom=0.3)
    s1 = plt.axes([0.25, 0.1, 0.55, 0.03], facecolor='lightgoldenrodyellow')
    slider1 = Slider(s1, 'CRT失真γ: ', 0.0, 4.0,
                      valfmt='%.f', valinit=1.0, valstep=0.1)
    slider1.on_changed(update_gamma)
    slider1.reset()
    slider1.set_val(2)

    plt.show()

数学原理:

伽马变换可以调节图片对比度,进而体现更多细节。

  • gamma < 1,提亮图像,扩展暗部的动态范围,压缩亮部的动态范围
  • gamma > 1,变暗图像,压缩暗部动态范围,扩展亮部动态范围

伽马变换:通过幂函数扩展后的动态范围没有变,只是改变了直方图的数据分布。

但伽马变换的曲线总是存在斜率约等于1的部分,如果图片的像素分布落在斜率等于1的区间,伽马变换的效果就比较微弱了。
所以引入分段线性变换

分段线性变换

顾名思义,是个分段函数,分多少段也看需求。假设分成三段。

以上是关于常见图像增强(python 实现)的主要内容,如果未能解决你的问题,请参考以下文章

常见图像增强(python 实现)

Python从0到1丨细说图像增强及运算

Python从0到1丨细说图像增强及运算

Python从0到1丨细说图像增强及运算

机器视觉实验一 图像增强的Matlab实现

目标检测:python实现多种图像数据增强的方法(光照,对比度,遮挡,模糊)