SQL删除不在另一个表中的行

Posted

技术标签:

【中文标题】SQL删除不在另一个表中的行【英文标题】:SQL delete rows not in another table 【发布时间】:2017-05-04 08:29:28 【问题描述】:

我正在寻找一种好的 SQL 方法(Oracle 数据库)来满足下一个要求:

    表 A 中删除 表 B 中不存在的行。 两个表的结构相同 有些字段是可为空的 列和行的数量巨大(要比较更多 100k 行和 20-30 列) 每一行的每个字段都需要从表 A表 B 进行比较。 这样的要求是由于必须每天运行一个流程,因为更改将来自 表 B

换句话说:表 A 减去表 B => 从 表 A

中删除记录
delete from Table A
           where (field1, field2, field3) in
                 (select field1, field2, field3
                    from Table A

                  minus
                  select field1, field2, field3
                    from Table B);

重要的是要提到 DELETE 子句中的普通 MINUS 失败,因为没有考虑可空字段上的空值(oracle 的结果未知,然后不匹配)。

我也成功地尝试了 EXISTS,但是我必须使用 NVL 函数将空值替换为虚拟值,我不想要它,因为我不能保证在 NVL 中替换的值会不是字段中的有效值。

有没有人知道一种方法来完成这样的事情?请记住 performance 和 nullable 字段是“必须的”。

谢谢你

【问题讨论】:

【参考方案1】:

decode 找到相同点(即使两个值都为空):

decode( field1, field2, 1, 0 ) = 1  

删除table2中未找到的table1中的行:

delete table1 t
 where t.rowid in (select t1.rowid
                     from table1 t1
                     left outer join table2 t2
                       on decode(t1.field1, t2.field1, 1, 0) = 1
                      and decode(t1.field2, t2.field2, 1, 0) = 1
                      and decode(t1.field3, t2.field3, 1, 0) = 1
                      /* ... */
                      where t2.rowid is null /* no matching row found */
                      ) 

使用现有索引

                      ...
                      left outer join table2 t2
                      on (t1.index_field1=t2.index_field1 or 
                          t1.index_field1 is null and t2.index_field1 is null)
                      and ...

【讨论】:

会尽力让你知道 ;)【参考方案2】:

在 where 子句中使用左外连接并测试 null

删除一个 从一个 a.x = b.x 上的左外连接 b 其中 b.x 为空

【讨论】:

不确定我是否正确理解了这样的“b.x 为空”:我想要将 a.x 与 b.x 进行比较,其中 a.x 可能为空,b.x 可能不为空,反之亦然。这种情况(将 null 与非 null 进行比较)应以任一方式标识为“不匹配”。你知道我的意思吗? 您可以扩展上述内容以加入所有需要的字段 - coalesce 允许您处理空值,即 where coalesce(a.x, 'zzUnlikelyValue') = coalesce(b.x, 'zzUnlikelyValue')【参考方案3】:

您是否考虑过 ORALCE SQL MERGE 语句?

【讨论】:

是的,我有,实际上我有一个 MERGE 语句,但是为了删除一行需要更新(我不希望这样的更新会“触发”一个将行复制到历史表+另一个触发器将删除的行复制到历史表,这意味着在删除操作中复制该行两次。【参考方案4】:

对大量记录使用批量操作。性能方面会更快。

并使用两个表之间的连接来获取要删除的行。可空列可以与一些默认值进行比较。

另外,如果你想让表A和表B相似,为什么不截断表A,然后从表b中插入数据

【讨论】:

谢谢,但是: - 我已经在使用 Bulk 来填充表 B(要与之比较的表)。 - 加入很好,但我想避免与默认值进行可空比较(这很危险,因为你不知道会发生什么并且可能会发生潜在的误导性匹配)。 - 我不能截断,因为我真的不希望表 A 类似于表 B,因为现有行也会更新。 但我想你必须为可空列提供默认值,否则我看不到任何其他方式。你可以给任何奇怪的值作为默认值 谢谢。我仍在尝试避免可空值的默认值。我不敢相信 oracle 没有提供一种优雅的方式来做这样的事情,比如比较 string.empty 或类似的东西,就像其他语言一样。【参考方案5】:

假设您在每个表上都有相同的 PK 字段...(拥有 PK 或其他一些唯一键对此至关重要。)

    create table table_a (id number, name varchar2(25), dob date);

    insert into table_a values (1, 'bob', to_date('01-01-1978','MM-DD-YYYY'));

    insert into table_a values (2, 'steve', null);

    insert into table_a values (3, 'joe', to_date('05-22-1989','MM-DD-YYYY'));

    insert into table_a values (4, null, null);

    insert into table_a values (5, 'susan', to_date('08-08-2005','MM-DD-YYYY'));

    insert into table_a values (6, 'juan', to_date('11-17-2001', 'MM-DD-YYYY'));

    create table table_b (id number, name varchar2(25), dob date);

    insert into table_b values (1, 'bob', to_date('01-01-1978','MM-DD-YYYY'));

    insert into table_b values (2, 'steve',to_date('10-14-1992','MM-DD-YYYY'));

    insert into table_b values (3, null, to_date('05-22-1989','MM-DD-YYYY'));

    insert into table_b values (4, 'mary', to_date('12-08-2012','MM-DD-YYYY'));

    insert into table_b values (5, null, null);

    commit;

    -- confirm minus is working
    select id, name, dob 
    from   table_a
    minus
    select id, name, dob
    from   table_b;

    -- from the minus, re-query to just get the key, then delete by key
    delete table_a where id in (
        select id from (
            select id, name, dob 
            from   table_a
            minus
            select id, name, dob
            from   table_b)
    );

    commit;

    select * from table_a;

但是,如果在某个时间点将 tableA 重置为与 tableB 相同,为什么不按照另一个答案的建议截断 tableA 并从 tableB 中全选。

100K 并不大。我可以在不到 1 秒的时间内对我的笔记本电脑实例进行约 100K 的截断和插入。

【讨论】:

正如我之前所说,MINUS 不适用于可空字段。另一方面,TableA 永远不必重置为与 TableB 相同的内容 我在本地使用 11G Express,通过 livesql.oracle.com 使用 12C。 MINUS 确实适用于空字段。如有必要,我可以提供示例。 是的,有这样的例子会很棒。可以复制剧本吗?如果可能,请尝试下一个场景(对我不起作用的场景): - 表定义中至少有 1 个字段可以为空。 - 以这样一种方式填充数据,即 TableA 中的行有一个为 NULL 的可空字段,TableB 有一些东西,例如“测试数据”。 - 以这样的方式填充数据,即 TableA 中的一行有一个为 NULL 的可为空字段,TableB 也有一个为 NULL 的字段。如果您尝试在上述条件下删除 TableA 中不在 TableB 中的行,它应该不起作用,至少对我来说不是。 THX 永远 发现可能是问题所在:表 B 没有 PK。如果减号仍然单独工作,这会影响删除操作吗? 任何唯一键都可以工作,单列或复合,但最好在非空列上,否则你将回到你开始处理 NVL 等的地方。【参考方案6】:
> DELETE FROM purchase WHERE clientcode NOT IN (
>     SELECT clientcode FROM client );

这将从购买表中删除其客户代码不在客户表中的行。 purchase表的clientcode引用client表的clientcode。

DELETE FROM TABLE1 WHERE FIELD1 NOT IN (SELECT CLIENT1 FROM TABLE2);

【讨论】:

据我所知,您的回答并未直接解决问题。

以上是关于SQL删除不在另一个表中的行的主要内容,如果未能解决你的问题,请参考以下文章

调整 SQL 表中的行

如何删除另一个表中存在的行?

删除不在 BigQuery 流式缓冲区中的行

根据另一个工作表中的可见范围删除行

如何从 SQL Server 中的表中删除重复行 [重复]

Mysql:从一个表中选择不在另一个表中的行