在oracle 数据伪列 rowid中删除重复的数据时。为啥数据插入的早,rowid 就小啊?我看不出来哪里小了

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在oracle 数据伪列 rowid中删除重复的数据时。为啥数据插入的早,rowid 就小啊?我看不出来哪里小了相关的知识,希望对你有一定的参考价值。

比较简单的方法是ROWID最后一位的字母越靠前,ROWID就越小。因此,最先插入的记录的ROWID最后一位是A,然后依次是B、C、D……

复杂一点的方法,可以ORACLE自带的DBMS_ROWID包,用法如下:

SQL> select dbms_rowid.rowid_row_number(rowid) N,rowid,t.empno from EMP_TEMP t;

         N ROWID                   EMPNO
---------- ------------------ ----------
         0 AAAXriAAEAAAAGzAAA       7369
         1 AAAXriAAEAAAAGzAAB       7499
         2 AAAXriAAEAAAAGzAAC       7521
         3 AAAXriAAEAAAAGzAAD       7566
         4 AAAXriAAEAAAAGzAAE       7654
         5 AAAXriAAEAAAAGzAAF       7698
         6 AAAXriAAEAAAAGzAAG       7782
         7 AAAXriAAEAAAAGzAAH       7788
         8 AAAXriAAEAAAAGzAAI       7839
         9 AAAXriAAEAAAAGzAAJ       7844
        10 AAAXriAAEAAAAGzAAK       7876
        11 AAAXriAAEAAAAGzAAL       7900
        12 AAAXriAAEAAAAGzAAM       7902
        13 AAAXriAAEAAAAGzAAN       7934

dbms_rowid.rowid_row_number(rowid)的作用就是解析出ROWID的行号。

参考技术A rowid也是按一种编码顺序进行排序的,是从小到大进行排序,和我们平时1、2、3、4这样,所以你越前面的数据是越最小的ROWID追问

我怎么看都看不出数据越早,ROWID越小

(转)Oracle中的rownum,ROWID的 用法

场景:在书写oracle的sql语句时候,如果语句不存在主键,需要删除几条重复的记录,这个时候如果不知道oracle中的伪列,就需要把所有的重复记录先删除,再插入。这样做好麻烦,可以通过伪列来定位记录。

1 ROWNUM的使用——TOP-N分析

使用SELECT语句返回的结果集,若希望按特定条件查询前N条记录,可以使用伪列ROWNUM。

ROWNUM是对结果集加的一个伪列,即先查到结果集之后再加上去的一个列 (强调:先要有结果集)。简单的说ROWNUM是符合条件结果的序列号。它总是从1开始排起的。

使用ROWNUM时,只能使用<、<=、!=符号。

 

举例:

student(学生)表,表结构为:

ID       char(6)      --学号

name    VARCHAR2(10)   --姓名

--建表

create table student (ID char(6), name VARCHAR2(10));

--添加测试记录

insert into student values(‘200001‘,‘张一‘);

insert into student values(‘200002‘,‘王二‘);

insert into student values(‘200003‘,‘李三‘);

insert into student values(‘200004‘,‘赵四‘);

commit;

--测试

SQL> select * from student;

ID     NAME

------ ------------------------

200001 张一

200002 王二

200003 李三

200004 赵四

1.1  rownum 对于等于某值的查询条件

如果希望找到学生表中第一条学生的信息,可以使用rownum=1作为条件。

但是想找到学生表中第二条学生的信息,使用rownum=2结果查不到数据。因为rownum都是从1开始,但是1以上的自然数在rownum做等于判断时认为都是false条件,所以无法查到rownum = n(n>1的自然数)。(oracle中存在这个情况)

SQL> select rownum,id,name from student where rownum=1;

    ROWNUM ID     NAME

---------- ------ ---------------------------------------------------

         1 200001 张一

 

对于rownum>1的记录查不到:

SQL> select rownum,id,name from student where rownum =2;

未选定行

1.2 rownum对于大于某值的查询条件

如果想找到从第二行记录以后的记录,当使用rownum>2是查不出记录的,原因是由于rownum是一个总是从1开始的伪列,Oracle 认为rownum> n(n>1的自然数)这种条件依旧不成立,所以查不到记录。

SQL> select rownum,id,name from student where rownum >2;

未选定行

 

那如何才能找到第二行以后的记录呢?

可以使用子查询方法来解决。注意子查询中的rownum必须要有别名,否则还是不会查出记录来,这是因为rownum不是某个表的列,如果不起别名的话,无法知道rownum是子查询的列还是主查询的列。

SQL>select * from(select rownum no ,id,name from student) where no>2;

        NO ID     NAME

---------- ------ ---------------------------------------------------

         3 200003 李三

         4 200004 赵四

 

rownum不起别名时候仍旧查不到:

SQL> select * from(select rownum,id,name from student)where rownum>2;

未选定行

1.3 rownum对于小于某值的查询条件

如果想找到第三条记录以前的记录,当使用rownum<3是能得到两条记录的。显然rownum对于rownum<n(n>1的自然数)的条件认为是成立的,所以可以找到记录。(不需要别名)

SQL> select rownum,id,name from student where rownum <3;

    ROWNUM ID     NAME

-------------------- ------ ---------------------------------------------------

1 200001 张一

               2 200002 王二

 

综上几种情况,可能有时候需要查询rownum在某区间的数据,可以看出

rownum对小于某值的查询条件是为true的,

rownum对于大于某值的查询条件直接认为是false的,但是可以间接的让它转为认为是true的。那就必须使用子查询。

例如要查询rownum在第二行到第三行之间的数据,包括第二行和第三行数据,那么我们可以写以下语句,先让它返回小于等于3的记录行,然后在主查询中判断新的rownum的别名列大于等于2的记录行。但是这样的操作会在大数据集中影响速度。

SQL> select * from (select rownum no,id,name from student where rownum<=3 ) where no >=2;

        NO ID     NAME

---------- ------ ---------------------------------------------------

         2 200002 王二

         3 200003 李三

 

1.4 rownum和排序

Oracle中的rownum是在取数据的时候产生的序号所以想对指定排序的数据指定rowmun行数据就必须注意了。

SQL> select rownum ,id,name from student order by name;

    ROWNUM ID     NAME

---------- ------ ---------------------------------------------------

         3 200003 李三

         2 200002 王二

         1 200001 张一

         4 200004 赵四

 

可以看出,rownum并不是按照name列来生成的序号。系统是按照记录插入时的顺序给记录排的号,rowid也是顺序分配的。为了解决这个问题,必须使用子查询

SQL> select rownum ,id,name from (select * from student order by name);

    ROWNUM ID     NAME

---------- ------ ---------------------------------------------------

         1 200003 李三

         2 200002 王二

         3 200001 张一

         4 200004 赵四

 

这样就成了按name排序,并且用rownum标出正确序号(由小到大)。

order by name 如果name是主键或有索引 ,查询出来的rownum完全按照1,2,3.....的次序。

SQL> alter table student add constraint pk_stu primary key(name);

SQL> select rownum ,id,name from student order by name;

ROWNUM ID NAME

---------- ------ ---------------------------------------------------

1 200003 李三

2 200002 王二

3 200001 张一

4 200004 赵四

 

2 ROWID的使用——快速删除重复的记录

ROWID是数据的详细地址,通过rowid,oracle可以快速的定位某行具体的数据的位置。

ROWID可以分为物理rowid和逻辑rowid两种。普通的表中的rowid是物理rowid,索引组织表(IOT)的rowid是逻辑rowid。

当表中有大量重复数据时,可以使用ROWID快速删除重复的记录。

举例:

--建表tbl

SQL> create table stu(no number,name varchar2(10),sex char(2));

--添加测试记录

SQL> insert into stu values(1, ‘ab‘,’男’);

SQL> insert into stu values(1, ‘bb‘,’女’);

SQL> insert into stu values(1, ‘ab‘,’男’);

SQL> insert into stu values(1, ‘ab‘,’男’);

       SQL>commit;

 

删除重复记录方法很多,列出两种。

2.1 通过创建临时表

可以把数据先导入到一个临时表中,然后删除原表的数据,再把数据导回原表,SQL语句如下:

SQL>create table stu_tmp as select distinct* from stu;

SQL>truncate table sut;                                                   //清空表记录

SQL>insert into stu select * from stu_tmp;                        //将临时表中的数据添加回原表

 

这种方法可以实现需求,但是很明显,对于一个千万级记录的表,这种方法很慢,在生产系统中,这会给系统带来很大的开销,不可行。

2.2 利用rowid结合max或min函数

使用rowid快速唯一确定重复行结合max或min函数来实现删除重复行。

下面的sql意思是:先找出相同的记录,然后保留rowid最大的记录,其他的都删除掉。

delete from stu a where rowid not in (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex = b.sex);                                          //这里max使用min也可以

 

或者用下面的语句

也是保留rowid最大的记录。

delete from stu a where rowid < (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex = b.sex);       //这里如果把max换成min的话,前面的where子句中需要把"<"改为">"

 

跟上面的方法思路基本是一样的,不过使用了group by,减少了显性的比较条件,提高效率。

ps:这个更直观,好好学习下。

delete from stu where rowid not in (select max(rowid) from stu t group by t.no, t.name, t.sex );

 

思考:若在stu表中唯一确定任意一行数据(1, ‘ab‘,’男’),把sex字段更新为”女”,怎么做?

update stu set sex=’女’ where rowid=(select min(rowid) from stu where no=1 and name=’ab’ and sex=’男’);

 。

以上是关于在oracle 数据伪列 rowid中删除重复的数据时。为啥数据插入的早,rowid 就小啊?我看不出来哪里小了的主要内容,如果未能解决你的问题,请参考以下文章

(转)Oracle中的rownum,ROWID的 用法

oracle数据库:去除重复记录 rowid

oracle用rowid去掉重复值

在oracle数据库表中没有添加rowid字段为啥会出现

oracle如何实现去重和分页

oracle数据库基本操作