“智能”滑动滑动窗口? [关闭]

Posted

技术标签:

【中文标题】“智能”滑动滑动窗口? [关闭]【英文标题】:Sliding a sliding window "intelligently"? [closed] 【发布时间】:2014-07-05 15:51:08 【问题描述】:

在滑动窗口对象检测器中,是否可以“智能”地进行对象检测?例如,如果一个人正在寻找一辆车,他们不会仰望天空寻找一辆车。但是使用滑动窗口的目标检测器会在整个图像(包括天空)上滑动窗口并在每个窗口上运行目标分类器,从而浪费了大量时间。有没有什么技术可以确保它只出现在合理的地方?

编辑

我知道我们必须至少查看所有内容一次,但我不想在每个窗口上运行繁重复杂的分类器。也许是某种预分类分类器?

【问题讨论】:

好吧,至少他必须做一次,所以他知道天空在哪里。如果天空被物体覆盖怎么办? 也许可以研究显着性和人类注视研究。一种天真的方法是只运行一个简单的边缘过滤器,进行归一化并对强度求和。高强度表示更多信息,值得用更多的计算机时间检查。这取决于您使用的分类器类型。例如,在 opencv 中实现的 Haar 级联检测器已经通过拒绝器执行此步骤,每个拒绝器执行类似于边缘过滤器的简单计算。因此,预计不会有太大的性能提升。 【参考方案1】:

您是否考虑过研究显着性检测算法?显着性检测算法可指示图像中人类最有可能关注的何处。一个很好的例子是一个人在一个开放的领域。天空的显着性较低,而人类的显着性较高。

也许首先将您的图像通过显着性检测算法,然后阈值并找到要搜索的区域而不是整个图像。

Stas Goferman 提出了一个很好的算法:Context-Aware Saliency Detection - http://webee.technion.ac.il/~ayellet/Ps/10-Saliency.pdf。

这里还有一些代码可以帮助您入门:https://sites.google.com/a/jyunfan.co.cc/site/opensource-1/contextsaliency

不幸的是,它在 MATLAB 中,并且您想从您的标签中查看 Python。但是,numpy / scipy 和 MATLAB 之间有很多相似之处,因此希望在您想转录任何代码时能对您有所帮助。

看看吧!

【讨论】:

谢谢!我也发现了这个:pdollar.wordpress.com/tag/representation 不错。感谢分享!

以上是关于“智能”滑动滑动窗口? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

Android浮动活动与滑动关闭

滑动窗口9:239. 滑动窗口最大值和480滑动窗口中位数

TCP 滑动窗口原理

算法总结之滑动窗口

LeetCode-滑动窗口滑动窗口最大值

Sentinel Go 核心统计结构滑动窗口的深度解析