一元特征和成本量(计算机视觉)
Posted
技术标签:
【中文标题】一元特征和成本量(计算机视觉)【英文标题】:Unary Features and Cost Volume (Computer Vision) 【发布时间】:2021-05-06 22:24:12 【问题描述】:我正在阅读一篇关于差异的论文,并遇到了以下短语:
“我们使用深度一元特征来计算立体 通过形成成本量来匹配成本。”
我在文献中查找了“一元特征”和“成本量”的定义,但很难找到任何东西。有人可以澄清这些术语在计算机视觉背景下的含义吗?
【问题讨论】:
【参考方案1】:对于单个 2D 补丁 (wxwx1),如果您要在另一张图像中寻找其最相似的兄弟,则每个像素都是候选像素,因此如果您将它们的相似度写在另一张图像中,它将是一个 2D 图像相似之处。您可以将其称为相似面或成本面(如果您将距离放入其中)。
在论文中,我似乎无法正确访问(我确实看到了它的存档 html 版本),对于 WxH 图像,它们存储了一个图像中一个特征之间的成本或距离,所有它周围的窗口中的像素。由于我们有 WxH 像素,并且窗口是 DXxDY,那么整个数组就是 WxHxDXxDY 的成本。所以它是 4D,但他们通过类比将其称为“成本体积”。
您还可以找到立体成本量,对于 WxH 图像和 D 种可能的深度或差异,我们可以构建 WxHxD 成本量。如果您要找到每个像素的最小成本,则不需要完整的体积,但如果您还将像素一起考虑(两个相邻像素可能具有相同的深度),那么您会查看完整的成本体积,而不仅仅是小体积切片。
【讨论】:
你好,你的解释可能很好,但我还是不明白,可能你可以添加一些架构或图片,或者如果你制作一个关于它的视频,那就太好了:)以上是关于一元特征和成本量(计算机视觉)的主要内容,如果未能解决你的问题,请参考以下文章