OpenCV2.4+遍历读写像素方法总结及时间度量

Posted qdsclove

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了OpenCV2.4+遍历读写像素方法总结及时间度量相关的知识,希望对你有一定的参考价值。

以下文本及代码基本基于《OpenCV 2.4.13.0 documentation》的How to scan images, lookup tables and time measurement with OpenCV一节,英文好的同学可以直接看原文。

  • 1. 颜色压缩

颜色压缩(Color Reduction)最简单的理解就是减少表示图像的颜色数目,我们都知道,8位位深的3通道RGB真彩图像包括了1600多万(16777216)的颜色数目,其实在某些应用中用不到这么多数量(例如图像传输(transmission)、分割(segmentation)、压缩(compression))的颜色。这也是一个研究的小方向,想了解更多,可以阅读文章Adaptive Color ReductionColor reduction and estimation of the number of dominant colors by using a self-growing and self-organized neural gas 。

在这里,我们实现一个很简单的方法:

I_old 为输入的像素值,I_new为输出的像素值,divideWidth代表要减少的度,我们可以理解为当divideWidth为128的时候,对于灰度图像就做的是一个阈值为128的二值化。

上点图更直观一点,左边为灰度原始图像,右边为输出图像:

当divideWidth为128时:

 

当divideWidth为64时:

根据以上描述,实际上这个公式我们可以建立一个映射表来避免重复计算,对于0-255的有限的输入值,建立输出值的映射表:

// color space divide width
const int divideWidth = 128;
// converting table for reducing color space
uchar table[256];
// first, we should build the converting table
for (int i = 0; i < 256; i++)
{
table[i] = (uchar)(divideWidth * (i / divideWidth));
}

  

我们的测试程序做的就是:

1. 读入一幅灰度图像和一幅RGB彩色图像;

2. 按照下文描述的四种访问像素的方式来实现这个算法;

3. 多次分别跑算法,取平均,对四种访问像素的方式进行对比。

  • 2. 图像数据的存储

首先大致说明下图像数据如何在内存中存储Mat是OpenCV2.x版本以上基本的图像类型,Mat可以视为一个矩阵,矩阵的大小依赖于该Mat是什么颜色空间(Color Space),比如最基本的灰度(Gray scale)或者RGB,CMYK,YCbCr等,因为这决定了该Mat具有多少个通道,一般来讲,灰度图像只有一个通道,而RGB图像具有三个通道。

对于灰度图像来讲,图像数据在内存中的存储如图所示:

 

对于多通道图像来讲,有几个通道,每一列就包含多少个子列。对于经常使用的基于RGB颜色空间,其图像数据存储如下:

 

需要注意的是通道的顺序是BGR而非RGB。

一般而言,图像数据的每一行在内存中都是连续存储的,因为这样对于遍历图像数据更高效。Mat提供了isContinuous()函数来获取是否是连续存储的数据。

  • 3. 时间的度量

OpenCV提供了两个简单的函数,getTickCount()getTickFrequency()。getTickCount返回从操作系统启动到当前所经的计时周期数,类型为int64。getTickFrequency返回每秒的计时周期数,类型为double。因此就可以用如下的代码计算以秒为单位的两个操作所耗费的时间:

double dtime = (double) getTickCount();
// do something
dtime = ((double)getTickCount() - dtime)/getTickFrequency();
  • 4. 图像像素的访问方式

4.1 ptr操作和指针-高效的方式

这种方式基于.ptr和C的[]操作,这种方式也是比较推荐的遍历图像的方式。

/** @Method 1: the efficient method
 accept grayscale image and RGB image */
int ScanImageEfficiet(Mat & image)
{
	// channels of the image
	int iChannels = image.channels();
	// rows(height) of the image
	int iRows = image.rows;
	// cols(width) of the image
	int iCols = image.cols * iChannels;

	// check if the image data is stored continuous
	if (image.isContinuous())
	{
		iCols *= iRows;
		iRows = 1;
	}

	uchar* p;
	for (int i = 0; i < iRows; i++)
	{
		// get the pointer to the ith row
		p = image.ptr<uchar>(i);
		// operates on each pixel
		for (int j = 0; j < iCols; j++)
		{
			// assigns new value
			p[j] = table[p[j]];
		}
	}

	return 0;
}

这里获取一个指向每一行的指针,然后遍历这一行所有的数据。当图像数据是连续存储的时候,只需要取一次指针,然后就可以遍历整个图像数据。

4.2 迭代器-比较安全的方式

相较于高效的方式需要自己来计算需要遍历的数据量,以及当图像的行与行之间数据不连续的时候需要跳过一些间隙。迭代器(iterator)方式提供了一个更安全的访问图像像素的方式。你只需要做的就是声明两个MatIterator_变量,一个指向图像开始,一个指向图像结束,然后迭代。

/** @Method 2: the iterator(safe) method
 accept grayscale image and RGB image */
int ScanImageIterator(Mat & image)
{
	// channels of the image
	int iChannels = image.channels();

	switch (iChannels)
	{
	case 1:
	{
		MatIterator_<uchar> it, end;
		for (it = image.begin<uchar>(), end = image.end<uchar>(); it != end; it++)
		{
			*it = table[*it];
		}
		break;
	}
	case 3:
	{
		MatIterator_<Vec3b> it, end;
		for (it = image.begin<Vec3b>(), end = image.end<Vec3b>(); it != end; it++)
		{
			(*it)[0] = table[(*it)[0]];
			(*it)[1] = table[(*it)[1]];
			(*it)[2] = table[(*it)[2]];
		}
		break;
	}
	}

	return 0;
}

彩色图像的话,由于是三个通道的向量,OpenCV提供了Vec3b的数据类型来存储。

  • 4.3 动态地址计算-更适合随机访问的方式

这种方式不推荐用来遍历图像,一般用在要随机访问很少量的图像数据的时候。基本用法就是指定行列号,返回该位置的像素值。不过需要你事先知道返回的数据类型是uchar还是Vec3b或者其他的。

/** @Method 3: random access method
 accept grayscale image and RGB image */
int ScanImageRandomAccess(Mat & image)
{
	// channels of the image
	int iChannels = image.channels();
	// rows(height) of the image
	int iRows = image.rows;
	// cols(width) of the image
	int iCols = image.cols;
	
	switch (iChannels)
	{
	// grayscale
	case 1:
	{
		for (int i = 0; i < iRows; i++)
		{
			for (int j = 0; j < iCols; j++)
			{
				image.at<uchar>(i, j) = table[image.at<uchar>(i, j)];
			}
		}
		break;
	}
	// RGB
	case 3:
	{
		Mat_<Vec3b> _image = image;
		for (int i = 0; i < iRows; i++)
		{
			for (int j = 0; j < iCols; j++)
			{
				_image(i, j)[0] = table[_image(i, j)[0]];
				_image(i, j)[1] = table[_image(i, j)[1]];
				_image(i, j)[2] = table[_image(i, j)[2]];
			}
		}
		image = _image;
		break;
	}
	}

	return 0;
}

4.4 查找表-一颗赛艇的方式

OpenCV大概也考虑到了有很多这种需要改变单个像素值的场合(比如基于单个像素值的亮度变换,gamma矫正等),因此在core模块提供了一个更加高效很一颗赛艇的LUT()函数来进行这种操作而且不需要遍历整个图像。

首先建个映射查找表:

// build a Mat type of the lookup table
Mat lookupTable(1, 256, CV_8U);
uchar* p = lookupTable.data;
for (int i = 0; i < 256; i++)
{
	p[i] = table[i];
}

然后调用LUT()函数:

// call the function
LUT(image, lookupTable, matout);

image是输入图像,matout是输出图像。

  • 5. 不同方式的性能度量

测试环境:OpenCV版本3.1.0,Windows 7 64位系统。

测试图像是512*512的Lena灰度图和512*512的Lena彩色图。分别跑100次不同的方法,然后得到的平均时间如下:

Debug版本:

Release版本:

总体时间表格如下:

 

灰度图像

(Debug)

灰度图像

(Release)

RGB图像

(Debug)

RGB图像

(Release)

高效的方式

1.1676

0.3039

3.5123

1.2646

迭代器的方式

151.4467

1.2219

270.9925

1.8997

随机访问的方式

78.6002

0.7484

328.5551

1.9967

LUT方式

0.7442

0.1687

2.1805

0.6941

 

可以看到不管Debug版本还是Release版本,性能上都是LUT方式>高效的方式>迭代器的方式和随机访问的方式。Debug版本后两种方式花费时间更大,Release版本四种方式都差别不是太大。从中也可以看出Debug版本与Release版本之间性能间的巨大差异。

 

参考链接:

1. http://docs.opencv.org/2.4/doc/tutorials/core/how_to_scan_images/how_to_scan_images.html#howtoscanimagesopencv

2. http://blog.csdn.net/xiaowei_cqu/article/details/7771760

以上是关于OpenCV2.4+遍历读写像素方法总结及时间度量的主要内容,如果未能解决你的问题,请参考以下文章

OpenCV-像素值读写(java版)

一,论文研读总结

Opencv2.4.9源码分析——Stitching

Opencv2.4.9源码分析——Stitching

Atitti opencv2.4 实现的人脸检测 attilax总结

opencv 四种图像遍历的时间度量