最近发现有被组织抛弃的危险,决定改过自新,好好工作。
17CVPR的ORAL,Fine-Grained Recognition as HSnet Search for Informative Image Parts。主要的工作是想通过搜索的方式发现更好的能够对分类结果产生帮助的region(s),结果只是报道了competitive
。novel的地方在于把LSTM放了进来,用于辅助搜索的迭代过程。
这幅图很能说明事情:

引入LSTM的工作,对比梯度优化中的动量法,看起来是对已经历的搜索过程进行更高级的综合。但由此产生的一个疑问是,就搜索过程来看,LSTM的作用应该是辅助进行搜索方向的判断,如果认同这种观点,那么一种合理的配合措施是,将每个b-box附近的box对应的ROIP送入LSTM中进行考察。
从paper上看,相关的工作只是在初始化时进行了:
