图像识别——《OpenCV3编程入门-毛星云》第二部分 初探core组件

Posted somebot

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图像识别——《OpenCV3编程入门-毛星云》第二部分 初探core组件相关的知识,希望对你有一定的参考价值。

博主QQ:1356438802

QQ群:473383394——UVC&OpenCV47




平台:Win7 64bits + Visual Studio 2012 + OpenCV 2.4.10


童鞋们,我们继续翻目录,哈哈哈

当然我不是翻目录,我是真的已经一字一句看过了,我自认为C语言基础还是很好的,代码方面可以看得很快。但是算法方面有点吃力。

下面红色文字是我自己的总结!


第二部分 初探core组件 83


第4章 OpenCV数据结构与基本绘图 85

4.1 基础图像容器Mat 86

4.1.1 数字图像存储概述 86

4.1.2 Mat结构的使用 86

OpenCV 1.x版本用IplImage作为图像存储结构体,OpenCV 2.0开始引入C++类,封装了Mat图像数据结构。

Mat类的好处,不必再手动为其开辟空间,不必再在不需要时立即释放,自动开辟自动释放。

浅拷贝: 拷贝构造函数 或者 赋值构造函数

深拷贝:clone() / copyTo()

4.1.3 像素值的存储方法 88

RGB:三原色

HSV/HLS:色调、饱和度和亮度/明度

4.1.4 显式创建Mat对象的七种方法 89

4.1.5 OpenCV中的格式化输出方法 91

cout << format(r, "python/csv/numpy/C/") << endl;

关键是format函数

4.1.6 输出其他常用数据结构 94

4.1.7 示例程序:基础图像容器Mat类的使用 95

4.2 常用数据结构和函数 95

4.2.1 点的表示:Point类 96

Point_<int> / Point2i / Point 互相等价;Point_<float> / Point2f 互相等价

4.2.2 颜色的表示:Scalar类 96

注意颜色顺序:Scalar(B, G, R);

4.2.3 尺寸的表示:Size类 96

尺寸就是宽度和高度,Size_<int> / Size2i / Size 三个类型名等价

4.2.4 矩形的表示:Rect类 97

Rect四个数据成员:x, y, width, height,分别为左上角点的坐标和整个矩形的宽高。

方法成员:Size()-宽高 / area()-面积 / tl()-左上角点坐标 / br()-右下角点坐标。

矩形交集:Rect rect = rect1 & rect2;

矩形并集:Rect rect = rect1 | rect2;

4.2.5 颜色空间转换:cvtColor()函数 98

函数原型:void cvtColor(InputArray src, OutputArray dst, int code, int dstCn=0)

案例:cvtColor(srcImage, DstImage, CV_BGR2GRAY);

强调:OpenCV默认的图片通道存储顺序是BGR,即蓝绿红,而不是RGB。

4.2.6 其他常用的知识点 100

4.3 基本图形的绘制 100

4.3.1 DrawEllipse()函数的写法 101

画椭圆,给定参数:椭圆中心点,矩形区域,旋转角度,线色,线宽,线型

4.3.2 DrawFilledCircle()函数的写法 102

画圆,给定参数:圆中心点,半径,线色,线宽(如果是-1,则圆是实心圆),线型

4.3.3 DrawPolygon()函数的写法 102

画多边形,给定参数:顶点集合,顶点数量,多边形数量,线色,线型

4.3.4 DrawLine()函数的写法 103

画线,给定参数:起点,终点,线色,线宽,线型

4.3.5 main函数的写法 104

应用实例,可以直接运行玩下效果先

4.4 本章小结 106



第5章 core组件进阶 107

5.1 访问图像中的像素 108

5.1.1 图像在内存之中的存储方式108

强调:OpenCV默认的图片通道存储顺序是BGR,即蓝绿红,而不是RGB。

注意图像在内存里面的阵列,首先有像素行列,然后每个像素还有多个通道。比如BGR三个通道的图像占内存,3*W*H Byte。

5.1.2 颜色空间缩减 108

一般用查表法

5.1.3 LUT函数:Look uptable操作 109

5.1.4 计时函数 110

getTickCount():CPU自开机后运行的时钟周期总数

getTickFrequency():CPU一秒钟花费的时钟周期数

5.1.5 访问图像中像素的三类方法110

a. 指针或者下标访问[]

uchar *data = outputImage.ptr<uchar>(i);   //获取第i行的首地址

data[j]或者*(data+j)

b. 迭代器iterator

Mat_<Vec3b>::iterator it = outputImage.begin<Vec3b>(); //将迭代器指向初始位置

(*it)[0]

(*it)[1]

(*it)[2]

c. 动态地址计算

outputIMage.at<Vec3b>(w, h)[0]--B

outputIMage.at<Vec3b>(w, h)[1]--G

outputIMage.at<Vec3b>(w, h)[2]--R

Vec3b,是由三个unsigned char组成的向量


5.1.6 示例程序 114

5.2 ROI区域图像叠加&图像混合 114

5.2.1 感兴趣区域:ROI 115

Region Of Interest:划出我们重点关注的区域

矩形法:imageROI = image(Rect(500, 250, logo.cols, logo.rows);

行列法:imageROI = image(Range(250, 250+logo.rows), Range(200, 200+logo.cols));

这个功能可以用来给图片加水印,呵呵。还有运动轨迹跟踪时,圈出跟踪目标。

5.2.2 线性混合操作 116

画面叠加、影片转场

5.2.3 计算数组加权和:addWeighted()函数 117

加权:dst = src1[I] * alpha + src2[I] * beta + gamma; 

gamma先不管, alpha + beta = 1,哪个值更大,哪张图片更清楚。

5.2.4 综合示例:初级图像混合120

结合ROI和addWeighted(),就可以加半透明的水印啦,哈哈

5.3 分离颜色通道、多通道图像混合 125

5.3.1 通道分离:split()函数 125

vector<Mat> channels;

split(srcImage, channels);

imageROI = channels.at(0);//BGR,at(0)就是蓝色通道数据

5.3.2 通道合并:merge()函数 126

split的逆操作

5.3.3 示例程序:多通道图像混合127

5.4 图像对比度、亮度值调整 131

5.4.1 理论依据 131

g(x) = a * f(x) + b

f(x)是源图像,g(x)是输出图像,a是增益(控制对比度,0.0-3.0),b是偏置(控制亮度)

5.4.2 访问图片中的像素 131

5.1.5章节中已经讲过了,为什么又要讲一遍!

5.4.3 示例程序:图像对比度、亮度值调整 132

两个滑动条,分别调整图片的对比度和亮度

5.5 离散傅里叶变换 135

5.5.1 离散傅里叶变换的原理135

将图像从空间域转换到频域。

在频域里,高频部分代表图像的细节、纹理信息;低频部分代表图像的轮廓信息。

傅里叶变换在图像处理中可以做到图像增强与图像去噪、图像分割之边缘检测、图像特征提取、图像压缩等

5.5.2 dft()函数详解 136

函数作用:对一维或二维浮点数数组进行正向或反向离散傅里叶变换。

例程看不懂,不知道目的是什么

5.5.3 返回DFT最优尺寸大小:getOptimalDFTSize()函数 137

计算DFT变换的尺寸

dftSize.width = getOptimalDFTSize(A.cols + B.cols - );

dftSize.height = getOptimalDFTSize(A.rows + B.rows -1);

getOptimalDFTSize函数返回给定向量尺寸的傅里叶最有尺寸大小。为了提高离散傅里叶变换的运行速度,需要扩充图像,而具体扩充多少,由此得到。

5.5.4 扩充图像边界:copyMakeBorder()函数 137

结合getOptimalDFTSize使用,将待处理图像扩充到最优尺寸,并初始化像素值

5.5.5 计算二维矢量的幅值:magnitude()函数 138

5.5.6 计算自然对数:log()函数 138

5.5.7 矩阵归一化:normalize()函数 138

5.5.8 示例程序:离散傅里叶变换139

程序看得懂,但是不知道目的是要干嘛嘞?!

5.6 输入输出XML和YAML文件 144

5.6.1 XML和YAML文件简介 144

XML——eXtensible Markup Language 可扩展标记语言

我知道它可以用来保存人脸识别的训练文件

5.6.2 FileStorage类操作文件的使用引导 144

负责XML文件的读写工作

5.6.3 示例程序:XML和YAML文件的写入 147

5.6.4 示例程序:XML和YAML文件的读取 148

5.7 本章小结 150



终于复习完了! 其实我是每次正在看当前的部分,同时写前一部分的文章,相当于我在复习前面的知识。
也就是说,此时我正在看本书第三部分的内容,同时在写本文——第二部分。 好了,我继续第三部分的学习了!!! 加油!


以上是关于图像识别——《OpenCV3编程入门-毛星云》第二部分 初探core组件的主要内容,如果未能解决你的问题,请参考以下文章

图像识别——《OpenCV3编程入门-毛星云》第二部分 初探core组件

图像识别——《OpenCV3编程入门-毛星云》第一部分 快速上手OpenCV

OpenCV3编程入门_毛星云编著_电子工业出版下载 񕄥

OpenCV3编程入门_毛星云编著pdf高清版免费下载

游戏开发大神“浅墨”《OpenCV3编程入门》作者毛星云“意外”离世

《OpenCV3编程入门》毛星云高清PDF无水印+源代码学习