一元特征和成本量(计算机视觉)

Posted

技术标签:

【中文标题】一元特征和成本量(计算机视觉)【英文标题】:Unary Features and Cost Volume (Computer Vision) 【发布时间】:2021-05-06 22:24:12 【问题描述】:

我正在阅读一篇关于差异的论文,并遇到了以下短语:

“我们使用深度一元特征来计算立体 通过形成成本量来匹配成本。”

我在文献中查找了“一元特征”和“成本量”的定义,但很难找到任何东西。有人可以澄清这些术语在计算机视觉背景下的含义吗?

【问题讨论】:

【参考方案1】:

对于单个 2D 补丁 (wxwx1),如果您要在另一张图像中寻找其最相似的兄弟,则每个像素都是候选像素,因此如果您将它们的相似度写在另一张图像中,它将是一个 2D 图像相似之处。您可以将其称为相似面或成本面(如果您将距离放入其中)。

在论文中,我似乎无法正确访问(我确实看到了它的存档 html 版本),对于 WxH 图像,它们存储了一个图像中一个特征之间的成本或距离,所有它周围的窗口中的像素。由于我们有 WxH 像素,并且窗口是 DXxDY,那么整个数组就是 WxHxDXxDY 的成本。所以它是 4D,但他们通过类比将其称为“成本体积”。

您还可以找到立体成本量,对于 WxH 图像和 D 种可能的深度或差异,我们可以构建 WxHxD 成本量。如果您要找到每个像素的最小成本,则不需要完整的体积,但如果您还将像素一起考虑(两个相邻像素可能具有相同的深度),那么您会查看完整的成本体积,而不仅仅是小体积切片。

【讨论】:

你好,你的解释可能很好,但我还是不明白,可能你可以添加一些架构或图片,或者如果你制作一个关于它的视频,那就太好了:)

以上是关于一元特征和成本量(计算机视觉)的主要内容,如果未能解决你的问题,请参考以下文章

计算机视觉图像处理面试笔试题整理——边缘检测

计算机视觉中算法 RANSAC

计算机视觉中的特征和关键点有啥区别?

『python』计算机视觉_OpenCV3角点特征Harris提取方法

计算机视觉-图像描述符(图片分类)

计算机视觉项目实战-图像特征检测harrissift特征匹配