如何提高我的爪子检测能力?
Posted
技术标签:
【中文标题】如何提高我的爪子检测能力?【英文标题】:How can I improve my paw detection? 【发布时间】:2011-05-04 12:39:55 【问题描述】:在我上一个关于finding toes within each paw 的问题之后,我开始加载其他测量值,看看它会如何保持。不幸的是,我在前面的一个步骤中很快遇到了问题:识别爪子。
你看,我的概念证明基本上采用了每个传感器的最大压力随着时间的推移,并开始寻找每一行的总和,直到它找到!= 0.0。然后它对列执行相同的操作,并且一旦找到超过 2 行且该行再次为零。它将最小和最大行和列值存储到某个索引。
如图所示,这在大多数情况下都非常有效。但是,这种方法有很多缺点(除了非常原始):
人类可以有“空心脚”,这意味着脚印本身有几行空。因为我担心(大型)狗也会发生这种情况,所以我等了至少 2 到 3 排空行,然后才剪掉了爪子。
如果另一个联系人在到达几个空行之前在不同的列中进行,则会产生问题,从而扩大区域。我想我可以比较这些列,看看它们是否超过某个值,它们必须是单独的爪子。
当狗很小或走得更快时,问题会变得更糟。发生的情况是,前爪的脚趾仍在接触,而后爪的脚趾刚刚开始在与前爪相同的区域内接触!
使用我的简单脚本,它无法拆分这两个,因为它必须确定该区域的哪些帧属于哪个爪子,而目前我只需要查看所有帧的最大值.
开始出错的示例:
所以现在我正在寻找一种更好的方法来识别和分离爪子(之后我将解决决定它是哪只爪子的问题!)。
更新:
我一直在努力实现乔的(真棒!)答案,但我在从我的文件中提取实际爪子数据时遇到了困难。
coded_paws 显示所有不同的爪子,当应用于最大压力图像时(见上文)。但是,该解决方案会遍历每一帧(以分离重叠的爪子)并设置四个 Rectangle 属性,例如坐标或高度/宽度。
我不知道如何获取这些属性并将它们存储在可以应用于测量数据的某个变量中。因为我需要知道每只爪子的位置,在哪些帧期间它的位置,并将它与它的爪子(前/后,左/右)耦合。
那么如何使用 Rectangles 属性来提取每个爪子的这些值?
我的公共 Dropbox 文件夹中有我在问题设置中使用的测量值(example 1、example 2、example 3)。 For anyone interested I also set up a blog 让您及时了解最新信息 :-)
【问题讨论】:
看起来你必须放弃行/列算法,因为你限制了有用的信息。 哇!猫控制软件? 实际上是狗数据@alxx ;-) 但是,是的,它将用于诊断它们! 为什么? (没关系,不知道更有趣......) 【参考方案1】:如果您只想要(半)连续区域,Python 中已经有一个简单的实现:SciPy 的ndimage.morphology 模块。这是一个相当常见的image morphology 操作。
基本上,您有 5 个步骤:
def find_paws(data, smooth_radius=5, threshold=0.0001):
data = sp.ndimage.uniform_filter(data, smooth_radius)
thresh = data > threshold
filled = sp.ndimage.morphology.binary_fill_holes(thresh)
coded_paws, num_paws = sp.ndimage.label(filled)
data_slices = sp.ndimage.find_objects(coded_paws)
return object_slices
稍微模糊输入数据以确保爪子具有连续的足迹。 (只使用更大的内核(structure
kwarg 到各种 scipy.ndimage.morphology
函数)会更有效,但由于某种原因这不能正常工作......)
对数组设置阈值,以便您拥有一个布尔数组,其中包含压力超过某个阈值的位置(即thresh = data > value
)
填充所有内部孔,使区域更清洁 (filled = sp.ndimage.morphology.binary_fill_holes(thresh)
)
找到单独的连续区域 (coded_paws, num_paws = sp.ndimage.label(filled)
)。这将返回一个数组,其中的区域由数字编码(每个区域都是一个唯一整数的连续区域(从 1 到爪子的数量),其他地方都是零)。
使用data_slices = sp.ndimage.find_objects(coded_paws)
隔离连续区域。这将返回slice
对象的元组列表,因此您可以使用[data[x] for x in data_slices]
获取每个爪子的数据区域。相反,我们将根据这些切片绘制一个矩形,这需要更多的工作。
下面的两个动画显示了您的“重叠爪子”和“分组爪子”示例数据。这种方法似乎工作得很好。 (不管它值多少钱,这比我机器上的下面的 GIF 图像运行得更流畅,所以爪子检测算法相当快......)
这是一个完整的例子(现在有更详细的解释)。其中绝大多数是读取输入并制作动画。实际的爪子检测只有 5 行代码。
import numpy as np
import scipy as sp
import scipy.ndimage
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle
def animate(input_filename):
"""Detects paws and animates the position and raw data of each frame
in the input file"""
# With matplotlib, it's much, much faster to just update the properties
# of a display object than it is to create a new one, so we'll just update
# the data and position of the same objects throughout this animation...
infile = paw_file(input_filename)
# Since we're making an animation with matplotlib, we need
# ion() instead of show()...
plt.ion()
fig = plt.figure()
ax = fig.add_subplot(111)
fig.suptitle(input_filename)
# Make an image based on the first frame that we'll update later
# (The first frame is never actually displayed)
im = ax.imshow(infile.next()[1])
# Make 4 rectangles that we can later move to the position of each paw
rects = [Rectangle((0,0), 1,1, fc='none', ec='red') for i in range(4)]
[ax.add_patch(rect) for rect in rects]
title = ax.set_title('Time 0.0 ms')
# Process and display each frame
for time, frame in infile:
paw_slices = find_paws(frame)
# Hide any rectangles that might be visible
[rect.set_visible(False) for rect in rects]
# Set the position and size of a rectangle for each paw and display it
for slice, rect in zip(paw_slices, rects):
dy, dx = slice
rect.set_xy((dx.start, dy.start))
rect.set_width(dx.stop - dx.start + 1)
rect.set_height(dy.stop - dy.start + 1)
rect.set_visible(True)
# Update the image data and title of the plot
title.set_text('Time %0.2f ms' % time)
im.set_data(frame)
im.set_clim([frame.min(), frame.max()])
fig.canvas.draw()
def find_paws(data, smooth_radius=5, threshold=0.0001):
"""Detects and isolates contiguous regions in the input array"""
# Blur the input data a bit so the paws have a continous footprint
data = sp.ndimage.uniform_filter(data, smooth_radius)
# Threshold the blurred data (this needs to be a bit > 0 due to the blur)
thresh = data > threshold
# Fill any interior holes in the paws to get cleaner regions...
filled = sp.ndimage.morphology.binary_fill_holes(thresh)
# Label each contiguous paw
coded_paws, num_paws = sp.ndimage.label(filled)
# Isolate the extent of each paw
data_slices = sp.ndimage.find_objects(coded_paws)
return data_slices
def paw_file(filename):
"""Returns a iterator that yields the time and data in each frame
The infile is an ascii file of timesteps formatted similar to this:
Frame 0 (0.00 ms)
0.0 0.0 0.0
0.0 0.0 0.0
Frame 1 (0.53 ms)
0.0 0.0 0.0
0.0 0.0 0.0
...
"""
with open(filename) as infile:
while True:
try:
time, data = read_frame(infile)
yield time, data
except StopIteration:
break
def read_frame(infile):
"""Reads a frame from the infile."""
frame_header = infile.next().strip().split()
time = float(frame_header[-2][1:])
data = []
while True:
line = infile.next().strip().split()
if line == []:
break
data.append(line)
return time, np.array(data, dtype=np.float)
if __name__ == '__main__':
animate('Overlapping paws.bin')
animate('Grouped up paws.bin')
animate('Normal measurement.bin')
更新:至于识别哪个爪子在什么时间与传感器接触,最简单的解决方案是只进行相同的分析,但同时使用所有数据。 (即将输入堆叠到 3D 数组中,并使用它,而不是单独的时间帧。)因为 SciPy 的 ndimage 函数旨在使用 n 维数组,我们不必修改原始的爪子查找函数完全没有。
# This uses functions (and imports) in the previous code example!!
def paw_regions(infile):
# Read in and stack all data together into a 3D array
data, time = [], []
for t, frame in paw_file(infile):
time.append(t)
data.append(frame)
data = np.dstack(data)
time = np.asarray(time)
# Find and label the paw impacts
data_slices, coded_paws = find_paws(data, smooth_radius=4)
# Sort by time of initial paw impact... This way we can determine which
# paws are which relative to the first paw with a simple modulo 4.
# (Assuming a 4-legged dog, where all 4 paws contacted the sensor)
data_slices.sort(key=lambda dat_slice: dat_slice[2].start)
# Plot up a simple analysis
fig = plt.figure()
ax1 = fig.add_subplot(2,1,1)
annotate_paw_prints(time, data, data_slices, ax=ax1)
ax2 = fig.add_subplot(2,1,2)
plot_paw_impacts(time, data_slices, ax=ax2)
fig.suptitle(infile)
def plot_paw_impacts(time, data_slices, ax=None):
if ax is None:
ax = plt.gca()
# Group impacts by paw...
for i, dat_slice in enumerate(data_slices):
dx, dy, dt = dat_slice
paw = i%4 + 1
# Draw a bar over the time interval where each paw is in contact
ax.barh(bottom=paw, width=time[dt].ptp(), height=0.2,
left=time[dt].min(), align='center', color='red')
ax.set_yticks(range(1, 5))
ax.set_yticklabels(['Paw 1', 'Paw 2', 'Paw 3', 'Paw 4'])
ax.set_xlabel('Time (ms) Since Beginning of Experiment')
ax.yaxis.grid(True)
ax.set_title('Periods of Paw Contact')
def annotate_paw_prints(time, data, data_slices, ax=None):
if ax is None:
ax = plt.gca()
# Display all paw impacts (sum over time)
ax.imshow(data.sum(axis=2).T)
# Annotate each impact with which paw it is
# (Relative to the first paw to hit the sensor)
x, y = [], []
for i, region in enumerate(data_slices):
dx, dy, dz = region
# Get x,y center of slice...
x0 = 0.5 * (dx.start + dx.stop)
y0 = 0.5 * (dy.start + dy.stop)
x.append(x0); y.append(y0)
# Annotate the paw impacts
ax.annotate('Paw %i' % (i%4 +1), (x0, y0),
color='red', ha='center', va='bottom')
# Plot line connecting paw impacts
ax.plot(x,y, '-wo')
ax.axis('image')
ax.set_title('Order of Steps')
【讨论】:
我什至无法解释你的回答有多棒! @Ivo:是的,我也很乐意再给 Joe 投票 :) 但我应该开始一个新问题,或者@Joe,如果你愿意,可以在这里回答吗? ***.com/questions/2546780/… 我实际上只是丢弃了 .png 文件,并做了一个convert *.png output.gif
。我之前确实让 imagemagick 让我的机器崩溃了,尽管它在这个例子中运行良好。过去,我使用此脚本:svn.effbot.python-hosting.com/pil/Scripts/gifmaker.py 直接从 python 编写动画 gif,而不保存单个帧。希望有帮助!我将在@unutbu 提到的问题上发布一个示例。
感谢@Joe 提供的信息。我的部分问题是忽略在plt.savefig
中使用bbox_inches='tight'
,另一个是不耐烦:)
天哪,我只想说 哇 这个答案太棒了。【参考方案2】:
我不是图像检测方面的专家,也不懂 Python,但我会试一试...
要检测单个爪子,您应该首先只选择压力大于某个小阈值的所有内容,非常接近于没有压力。高于此的每个像素/点都应该被“标记”。然后,与所有“标记”像素相邻的每个像素都被标记,并且此过程重复几次。将形成完全连接的质量,因此您有不同的对象。然后,每个“对象”都有一个最小和最大 x 和 y 值,因此边界框可以整齐地包装在它们周围。
伪代码:
(MARK) ALL PIXELS ABOVE (0.5)
(MARK) ALL PIXELS (ADJACENT) TO (MARK) PIXELS
REPEAT (STEP 2) (5) TIMES
SEPARATE EACH TOTALLY CONNECTED MASS INTO A SINGLE OBJECT
MARK THE EDGES OF EACH OBJECT, AND CUT APART TO FORM SLICES.
应该差不多了。
【讨论】:
【参考方案3】:注意:我说的是像素,但这可能是使用像素平均值的区域。优化是另一个问题...
听起来您需要分析每个像素的函数(压力随时间变化)并确定where the function turns(当它在另一个方向上改变 > X 时,它被视为转向反错误)。
如果您知道它在哪个帧转动,您就会知道压力最大的帧,以及两只爪子之间压力最小的帧。理论上,您将知道爪子最用力按压的两个帧,并可以计算出这些间隔的平均值。
之后我将解决决定它是哪只爪子的问题!
这与以前的游览相同,知道每只爪子何时施加最大压力有助于您做出决定。
【讨论】:
以上是关于如何提高我的爪子检测能力?的主要内容,如果未能解决你的问题,请参考以下文章