Mysql - 用多个前行(不仅仅是一个)模拟滞后
Posted
技术标签:
【中文标题】Mysql - 用多个前行(不仅仅是一个)模拟滞后【英文标题】:Mysql - Simulate lag with multiple previous rows (not just one) 【发布时间】:2019-02-04 08:10:14 【问题描述】:经过几个小时的努力,模拟延迟(我在 mysql 5.6 上没有升级选项),并发现一对功能问题,我来这里寻求一点帮助,我现在完全迷失在这里。
经过长时间的处理后,我在存储过程中获得了一个临时表,其中包含用户 ID 和购买日期(示例)的以下数据顺序:
样品是通过以下方式获得的:
SELECT
purchaseId
,userId
,purchaseDate
FROM tempPurchases
WHERE userId > 69
ORDER BY userId, purchaseDate;
+------------+--------+--------------+
| purchaseId | userId | purchaseDate |
+------------+--------+--------------+
| 2074 | 70 | 2018-11-12 |
| 2072 | 70 | 2018-11-30 |
| 2108 | 71 | 2018-01-23 |
| 2114 | 71 | 2018-02-27 |
| 2130 | 71 | 2018-03-07 |
| 2115 | 71 | 2018-04-17 |
| 2105 | 71 | 2018-11-12 |
| 2112 | 71 | 2018-11-30 |
| 2145 | 72 | 2018-01-21 |
| 2141 | 72 | 2018-01-23 |
| 2136 | 72 | 2018-02-01 |
| 2148 | 72 | 2018-03-02 |
| 2158 | 72 | 2018-06-06 |
| 2137 | 72 | 2018-07-04 |
| 2139 | 72 | 2018-07-11 |
| 2153 | 72 | 2018-10-18 |
| 2135 | 72 | 2018-10-25 |
| 2157 | 72 | 2018-11-12 |
| 2147 | 72 | 2018-12-30 |
| 2184 | 73 | 2018-02-21 |
| 2166 | 73 | 2018-03-14 |
| 2176 | 73 | 2018-05-12 |
| 2186 | 73 | 2018-07-09 |
| 2173 | 73 | 2018-08-25 |
| 2162 | 73 | 2018-11-12 |
| 2165 | 73 | 2018-11-30 |
+------------+--------+--------------+
规范是在 30 天内通过购买获得“奖金”(我使用 TIMESTAMPDIFF(DAYS)
和 lag 来计算一个日期与前一个日期之间的天数差异。这里的问题是奖金也与多个前一个日期进行比较行,而不仅仅是上面的行。(A 列的逻辑)
例如,在下一个示例中,对于用户 ID 72,purchaseId 2136 与 2141 匹配,但也与 2145 匹配,当然这是可变的,例如一个人今天购买了 10 次,昨天购买了 20 次。
所以想要的结果是:
+------------+--------+--------------+-----------+------------+--------------------------+
| purchaseId | userId | purchaseDate | days diff | A (streak) | B (streak without reset) |
+------------+--------+--------------+-----------+------------+--------------------------+
| 2074 | 70 | 2018-11-12 | 0 | 0 | 0 |
| 2072 | 70 | 2018-11-30 | 18 | 1 | 1 |
| 2108 | 71 | 2018-01-23 | 0 | 0 | 0 |
| 2114 | 71 | 2018-02-27 | 35 | 0 | 0 |
| 2130 | 71 | 2018-03-07 | 8 | 1 | 1 |
| 2115 | 71 | 2018-04-17 | 41 | 0 | 0 |
| 2105 | 71 | 2018-11-12 | 209 | 0 | 0 |
| 2112 | 71 | 2018-11-30 | 18 | 1 | 1 |
| 2145 | 72 | 2018-01-21 | 0 | 0 | 0 |
| 2141 | 72 | 2018-01-23 | 2 | 1 | 1 |
| 2136 | 72 | 2018-02-01 | 9 | 2 | 2 |
| 2148 | 72 | 2018-03-02 | 29 | 1 | 3 |
| 2158 | 72 | 2018-06-06 | 96 | 0 | 0 |
| 2137 | 72 | 2018-07-04 | 28 | 1 | 1 |
| 2139 | 72 | 2018-07-11 | 7 | 1 | 2 |
| 2153 | 72 | 2018-10-18 | 99 | 0 | 0 |
| 2135 | 72 | 2018-10-25 | 7 | 1 | 1 |
| 2157 | 72 | 2018-11-12 | 18 | 2 | 2 |
| 2147 | 72 | 2018-12-30 | 48 | 0 | 0 |
| 2184 | 73 | 2018-02-21 | 0 | 0 | 0 |
| 2166 | 73 | 2018-03-14 | 21 | 1 | 1 |
| 2176 | 73 | 2018-05-12 | 59 | 0 | 0 |
| 2186 | 73 | 2018-07-09 | 58 | 0 | 0 |
| 2173 | 73 | 2018-08-25 | 47 | 0 | 0 |
| 2162 | 73 | 2018-11-12 | 79 | 0 | 0 |
| 2165 | 73 | 2018-11-30 | 18 | 1 | 1 |
+------------+--------+--------------+-----------+------------+--------------------------+
多次加入/左加入和滞后模拟完全丢失,任何提示、评论或答案都将受到重视。请不要在评论中怀疑或提出任何问题。
问题: 我怎样才能得到这个计算 A streak 照顾上面几行的“滞后”? 我的实际方法是使用游标,但目前都不起作用。
更新:
预期的结果是获得“奖励连胜”,注意同一用户 ID 的上述行。例如:
userId 72 于 1 月 1 日购买(购买 1)(第一行值为 0)。然后在 10 月 10 日再次(购买 2),因此不到 30 天:1 点(10 天)。再次在 15/01(购买 3),因此购买 2(5 天)和购买 1(15 天)之间的差异为 1 分。总奖金:3 (0 + 1 + (1+1))
【问题讨论】:
你还有什么问题? @SalmanA 嗨!谢谢,我刚刚更新了我的帖子,抱歉不清楚,我想我需要更多的咖啡(这里是早上 5:20) 我们需要更多/更好地描述您的逻辑。 为了更具体,我添加了一个段落来解释奖金的“逻辑” 【参考方案1】:相信就这么简单,select里面的子查询统计过去30天的购买次数:
SELECT t.*, (
SELECT COUNT(*)
FROM t AS x
WHERE userId = t.userId
AND purchaseDate < t.purchaseDate
AND purchaseDate >= t.purchaseDate - INTERVAL 30 DAY
) AS purchases_within_30days
FROM t
【讨论】:
问题(我认为,如果不是请纠正我)是如果用户直到三月才购买,奖金将重置。但是让我转换它并测试它! (感谢您的宝贵时间!) 呃,无法重新打开表,是临时的:(以上是关于Mysql - 用多个前行(不仅仅是一个)模拟滞后的主要内容,如果未能解决你的问题,请参考以下文章
MySQL按查询分组,多个总和不使用索引,滞后于使用文件排序