oracle数据库:去除重复记录 rowid

Posted 谦谦均

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了oracle数据库:去除重复记录 rowid相关的知识,希望对你有一定的参考价值。

rowid介绍

rowidoracle中的一个重要的概念。用于定位数据库中一条记录的一个相对唯一的地址值。通常情况下,该值在该行数据插入到数据库表时即被确定且唯一。rowid它是一个伪列,它并不实际存在于表中。它是oracle在读取表中数据行时,根据每一行数据的物理地址信息编码而成的一个伪列。所以根据一行数据的rowid能找到一行数据的物理地址信息,从而快速地定位到数据行。数据库的大多数操作都是通过rowid来完成的,而且使用rowid来进行单行记录定位速度是最快的。

  • 有时繁杂的数据检索时,普通检索条件不能达到要求,可以利用rowid来精确检索结果。

oracle中如果要查询某张表中的多个字段,又只对某个字段去重的时候用distinct关键字或者group by都不行,【distinctgroup by会对要查询的字段一起进行去重,也就是当查询的所有字段都相同,oracle才会认为是重复的】,这时可以使用rowid

重复记录的查找

题目场景:当我们表里面出现了许多的重复记录时,我们需要将重复的记录找出来。
实现步骤:

  1. 按照重复内容分组
  2. 取出每一组的一条记录并且保留【注意具有唯一性】
  3. 删除未在保留范围的数据

准备数据:test表

--创建test表
create table test(
       name varchar(20),
       age number(3),
       sex varchar(10),
       weight number(3)
)

上面定义了4个字段,分别是姓名,年龄,性别,体重。接下来往里面添加数据。

--添加数据
insert into test values('貂蝉',22,'女',96);
insert into test values('小乔',24,'女',95);
insert into test values('孙尚香',21,'女',92);
insert into test values('露娜',20,'女',94);
insert into test values('女娲',26,'女',97);
insert into test values('甄姬',23,'女',91);
insert into test values('安琪拉',22,'女',98);
insert into test values('貂蝉',22,'女',96);
insert into test values('小乔',24,'女',95);
insert into test values('孙尚香',21,'女',92);
insert into test values('露娜',20,'女',94);
insert into test values('女娲',26,'女',97);
insert into test values('甄姬',23,'女',91);
insert into test values('安琪拉',22,'女',98);

这里故意添加一些重复的数据,接下来要用到这些,现在看一下表中的内容:
在这里插入图片描述
可以看到表中重复数据的内容也一模一样,来查看一下rowid

--查看rowid
select name,age,sex,weight,rowid from test order by age desc;

这里为了方便比较相同内容的rowid是不是一样,使用了排序。
在这里插入图片描述
可以看到尽管内容都一样,但是rowid不一样。
现在来完成一个操作:将所有相同的记录只保留一份

  1. 将数据进行分组,按照重复信息分组
  2. 在每一组里面选取一条记录进行保存,取出特性:rowid
  3. 删除时,找那些不在保留范围内的数据,将不再范围的数据删除。
--将数据进行分组,按照重复信息分组
select name,sex,age,weight from test group by name,sex,age,weight;

将数据分组,这里将所有信息都查出来:
在这里插入图片描述
一共有7组数据,现在要每组数据取一条数据出来,因为其他的字段内容都相同,这里只能取rowid

--找到每组最小的rowid,也可以取最大的
select min(rowid) from test group by name,sex,age,weight;

这里每组都取了一个rowid,如下图所示:
在这里插入图片描述
接下来只需要把不在这里的rowid的行删除即可,先把不在里面的rowid的行找出来:

--找到要删除的数据
select * from test where rowid not in (select min(rowid) from test group by name,sex,age,weight);

这里以刚才的结果集为查询目标,用not in函数找到要删除的rowid
在这里插入图片描述
这里没有显示rowid,所有看不到,接下来只需要把这些数据删除即可:

delete from test where rowid not in (select min(rowid) from test group by name,sex,age,weight);
commit

执行完删除之后提交一下事务,接着来查询表中所有数据看看:
在这里插入图片描述
可以看到重复的数据都只有一条了,这就是rowid去除重复记录的用法。

以上是关于oracle数据库:去除重复记录 rowid的主要内容,如果未能解决你的问题,请参考以下文章

Oracle查询去除重数据

删除oracle 表中重复数据sql语句保留rowid最小的一条记录

如何确定Oracle数据库表中重复的记录

Oracle

informix/oracle rowid 问题

Oracle中用Rowid查找和删除重复记录!