跳过第一条重复记录并更新其他记录

Posted 2023-02-16

技术标签:

【中文标题】跳过第一条重复记录并更新其他记录【英文标题】：skip first duplicate record and update others 【发布时间】：2018-11-20 16:54:37 【问题描述】：

查询1：检查是否存在重复记录：

SELECT
    id , username, COUNT(*)
FROM
   tbluser
GROUP BY
   username
HAVING 
    COUNT(*) > 1;

结果：

查询 2：针对一个数据集监控重复记录。

select * from tbluser where username = 'abcuser1';

结果：

查询 3：（基于查询 2 中的数据，跳过第一条记录，即 293 并更新所有其他重复事件的状态。

我目前的方法：

    SELECT CONCAT(id , ',') 
FROM    tbluser u1
WHERE   EXISTS
        (
        SELECT  1
        FROM    tbluser u2
        WHERE   u1.username = u2.username and u1.status = u2.status = 1 and u1.appId = u2.appId 
        LIMIT 1, 1
        )
        limit 1, 18446744073709551615

上面的查询给了我需要更新状态的重复记录的 ID。然后我将上面的结果 id 粘贴到：

update tbluser set status = 0 where id in (1,2);

查询 3 没有给出想要的结果。它只是跳过第一条记录并给出所有数据集的所有其他重复记录。

如何跳过每个数据集中的第一条重复记录？

【问题讨论】：

【参考方案1】：

这是一种方式：

UPDATE tbluser t
JOIN (
   SELECT username, MIN(id) AS min_id
   FROM tbluser
   GROUP BY username
) AS g ON t.username = g.username AND t.id <> min_id
SET status = 0;

上述查询会更新所有id 值大于username 切片中的最小值id 的记录。

Demo here

【讨论】：

以上是关于跳过第一条重复记录并更新其他记录的主要内容，如果未能解决你的问题，请参考以下文章