Oracle海量数据(1000w+)重复数据删除方法

Posted 老萌新码客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Oracle海量数据(1000w+)重复数据删除方法相关的知识,希望对你有一定的参考价值。

方法1:delete from xxx(表名) where rowid not in( select max/min(rowid) from xxx(表名) group by xxx(需要去重的列名,可以跟逗号实现多个列名去重))。

此方法采用直接删除的方法。但是效率比较低,数据量小的话可以使用。对于超过100w的数据推荐用方法2.

方法2:create table xxx(自定义表名) as select *(如果只需要部分列就直接把需要的列写出来) from xxx(表名)where rowid in (select max/min(rowid) from xxx(表名) group by xxx(需要去重的列名,可以跟逗号实现多个列名去重)) 

此方法采用将非重复数据导出至中间表的方法。可将原表drop,中间表重命名。也可以将中间表数据再导回至原表(暂未实践)。此方法效率较方法1效率有极大的提高。推荐用此方法。

以上是关于Oracle海量数据(1000w+)重复数据删除方法的主要内容,如果未能解决你的问题,请参考以下文章

oracle上亿表海量数据进行大批量数据删除有啥好的解决方案

巧用MapReduce+HDFS,海量数据去重的五种方法

oracle删除重复的行怎么删啊

oracle删除重复的行怎么删啊

Oracle中如何删除重复数据

大数据操作:删除和去重