跌倒时识别物体 - 视点变化
Posted
技术标签:
【中文标题】跌倒时识别物体 - 视点变化【英文标题】:Recognize objects while falling - viewpoint variation 【发布时间】:2018-06-19 19:12:20 【问题描述】:我有一个问题陈述来识别同一物体(瓶盖)的 10 类不同变化(颜色和大小的变化),同时考虑到相机看到物体的不同视点。我已将其拆分为子任务
1) 训练了一个深度学习模型,只对物体的平面进行分类,并在此尝试中成功。
示例 2 类的平面
2) 没有考虑到跌落,而是针对可能的视角变化训练了一个模型 - 不成功。
样本2类的感知变化
即使是视角发生变化,也有哪些方法可以识别对象。我不限于使用单个相机解决方案。对解决这个可变感知问题的想法持开放态度。
任何帮助都非常感谢,在此先感谢!
【问题讨论】:
【参考方案1】:我想给你的答案是:CapsNets
你一定要看看这篇论文,在那里你将了解 CNN 的一些缺点以及它们是如何解决这些缺点的。
也就是说,当视角发生变化时,我很难相信您的架构无法成功解决问题。您的数据集非常小吗?我希望神经网络能够学习褶皱边缘的过滤器,这可以从各个角度看到。
如果您不限于一台相机,您可以尝试训练一个“正常”分类器,您可以在生产中提供多张图像并对预测进行平均。或者,您可以构建一个同时包含多个视角的架构。你必须自己尝试,什么是最好的。
此外,永远不要低估老式图像预处理的力量。如果你有 3 个不同的视角,你可以选择最接近“平面”视角的那个。这可能就像使用具有最大颜色区域的图像一样简单,其中img.sum()
最高。
另一个想法是通过显式编程找出颜色,这应该相当容易,然后为网络提供灰度图像。也许您的网络被颜色的强相关性弄糊涂了,完全忽略了形状。
【讨论】:
以上是关于跌倒时识别物体 - 视点变化的主要内容,如果未能解决你的问题,请参考以下文章
opengl如何实现鼠标场景漫游 视点随着鼠标的移动发生变化 刚刚接触opengl所以不大懂(不用glut的情况下)