点标注像素级视觉任务Ground Truth
Posted foda-dingzhibing
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了点标注像素级视觉任务Ground Truth相关的知识,希望对你有一定的参考价值。
像素级视觉任务:需要对每个像素进行精确标记的像素级任务,例如语义分割中的类别掩码和图像去噪中的干净图片。
图像级视觉任务:常规的使用框标注的任务,都认为是图像级视觉任务。
Label Generation:标签生成,从更高层次的说监督学习需要制定标签,那接着就是开始annotation,annotation中涉及多种类型的标注方式。
annotation:标注,即为为监督学习提供标签信息。
Bounding-box Label:就是框标注,我经常在YOLO目标检测中使用的标注方法。
Density Map:密度图标注
Point/Dot Map:点标注
RAZ’s Cruciform Label:十字标注
Independent Instance Map :独立实例图标注,也可以理解为二值化标注。
Ground Truth:把它理解为真值、真实的有效值或者是标准的答案.
图像的尺度 :这里图像的尺度并非指图像的大小,而是指图像的模糊程度(σ) ,例如,人近距离看一个物体和远距离看一个物体模糊程度是不一样的,从近距离到远距离图像越来越模糊的过程,也是图像的尺度越来越大的过程。
backgrounds:干扰目标识别的区域的像素。
前景:目标对象存在的区域
二值图像:将前景和背景转化成0或者1数值的图像。
Metrics:指标
迁移学习:迁移学习我们在做项目的时候一直在使用,但是有时候有人问你,你不一定能回答上来,简单来说就是我们借助别人训练的预训练模型、数据去做和我们相近的业务。
滤波器、卷积核:这两个概念是一样的,可以理解为是别名。
卷积:翻转——>滑动——>叠加——>滑动——>叠加——>滑动——>叠加,根据数学定义,离散变量的积分就是求和,在函数进行反转,及约束条件下,针对单通道的二维图像卷积操作就是滤波器和对应数值进行内积求和。卷积的作用是去提取目标对象的特征。
池化:池化可理解为是下采样,就是把卷积提取的特征进行压缩。
全连接:为了实现分类,我们需要把提取的特征拉成一维向量。
padding:为了保证边缘数据不被丢失,所以我们会在边缘填充0值,这样既不会影响图像的特征大小,还不会影响特征变化。填充的方式有2中,分别是valid和same,same经过卷积后,和输入的尺寸保持不变。
最大池化:经过滤波器卷积操作后,取最大的数值作为特征值。
平均池化:经过滤波器卷积操作后,取平均数值作为特征值。
网络层数的定义:只有包含参数的层数,才定义为一层,例如激活函数、pool层中不需要去学习参数,所以不别看做神经网络的层数。
以上是关于点标注像素级视觉任务Ground Truth的主要内容,如果未能解决你的问题,请参考以下文章