PIG 可以通过将一条线与其他线进行比较来过滤吗?

Posted

技术标签:

【中文标题】PIG 可以通过将一条线与其他线进行比较来过滤吗?【英文标题】:CAN PIG FILTER BY COMPARING A LINE WITH OTHER LINES? 【发布时间】:2013-07-16 18:21:14 【问题描述】:

这是一个猪拉丁问题。我的数据有3个字段如下:

usrid 时间距离

020204 09:23:45 350.1103

020204 09:29:48 350.1522

222292 14:01:34 1.992134

我想删除一行,如果有另一行具有相同的usid,这样两行之间的时间间隔小于10分钟。例如第 2 行必须删除,因为第 1 行具有相同的 usrid,而 2 之间的时间间隔仅为 ~6 分钟。

【问题讨论】:

【参考方案1】:

请参考这里,

Pig de-duplicate events occuring within 1 minute of each other

同样的要求。滑动时间窗口。问题中有可能的解决方案/建议

【讨论】:

以上是关于PIG 可以通过将一条线与其他线进行比较来过滤吗?的主要内容,如果未能解决你的问题,请参考以下文章

CAD画图时用TR一次只能剪切一条线.用啥快捷键框选的方式一次剪掉多条线?

最佳拟合线与R中的阈值

判断一条线与四边形的交点

当一条线与一个区域重叠时,如何使用 GDI+ 更改它的颜色?

将一条线分成2个不同的字符串[重复]

将一条线分成它的组件