数据库sql去重

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据库sql去重相关的知识,希望对你有一定的参考价值。

参考技术A 1 去重
1.1 查询
1.1.1 存在部分字段相同的纪录,即有唯一键主键ID
最常见情况如果是这种情况的话用distinct是过滤不了的,这就要用到主键id的唯一性特点及group by分组
select * from table where id in (select max(id) from table group by [去除重复的字段名列表,....])
1.1.2 存在两条完全相同的记录用关键字distinct就可以去掉
select distinct id(某一列) from table(表名) where (条件)
1.1.3 查找表中不含重复的数据,根据单个字段(id)来判断
select * from table where id in (select id from table group by id having count (id) >1)
1.1.4 查找表中重复的数据,根据单个字段(id)来判断
select * from table where id not in (select id from table group by id having count (id) >1)

1.1.5 查询全部的重复信息
select * from people where id not in (select min(id) from people group by name,sex HAVING COUNT(*) < 2)
1.1.6 查询全部的重复信息
select * from table where id not in (select MIN(id) from table group by name,sex)
1.1.7 删除多余重复的信息,只保留最小ID
delete from table where id not in(select MIN(id) from table group by name,sex)

SQL去重

现在有一张表t(id,name),id是主键,name可以重复,现在要删除重复数据,保留id最小的数据。请写出SQL。

表:t

id        name

1        张三

2        张三

3        李四

4        李四

5        李四

分析:

首先通过名字分组,选出每组id最小记录。然后删除这些记录以外的所有数据。

1:select min(id) id,name from t groud by name.

重点:min(),groud by, not exists()

完整的SQL:

 

delete from t a where not exists( select * from ( select min(id) ,name from t group by name) b where a.id=b.id)

 

 

 

以上是关于数据库sql去重的主要内容,如果未能解决你的问题,请参考以下文章

SQL如何去重?

sql语句去重

SQL多个字段如何去重

sql语句去重

Hive sql大数据有道之Hive sql去重

sql去重问题怎样去不掉重复的呢?