hive如何去掉重复数据,显示第一条

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive如何去掉重复数据,显示第一条相关的知识,希望对你有一定的参考价值。

参考技术A 去重没问题啊,distinct 就好了,显示第一条可以用row_number函数,不同版本hive的row_number有所不同,你自己查一下吧,row_number可以对同一个key从1开始编号的。

sql中如何使一列中的多个重复数据只显示第一条

按照左边如果有重复的就取右边的第一个

1、首先在如下图中是一个Student的数据表,这里需要对数据表中的StudentName数据表中的单个的数据进行修改。

2、同样的方法这里首先打开数据库查询语句,输入查询语句先查询一下数据表中的数据内容。

3、输入查询语句,:Select * from Student,输入完毕之后选择全部内容,然后选择执行按钮,执行SQL语句。

4、执行完毕之后,在Student表中的第四行数据(StudentName中的“崔”)这里需要把它修改为“亮亮”,注意这里只要修改的是单个数据,并不是整行数据。

5、在数据表上,用鼠标右击选择里面的“编辑前200行”。

6、编辑完毕之后,就可以在查询表中看到所有数据了,如下图中红线内容。

参考技术A

select AdviceName,max(authName_1) as authName_1 from table

group by AdviceName

说明:

    因为你只选择这1个列作为相同条件列,所以我分组条件就这样写的

    因为你要取第一个人名的话,max就OK了


觉得好,就请采纳

追问

如果我选择AdviceTime和AdviceName作为相同列的条件,是不是group by 后边要加上AdviceTimene ?

追答

select AdviceName,AdviceTime,max(authName_1) as authName_1 from table
group by AdviceName,AdviceTime

像这样,几个相同列条件就加几个

本回答被提问者采纳

以上是关于hive如何去掉重复数据,显示第一条的主要内容,如果未能解决你的问题,请参考以下文章

sql中如何使一列中的多个重复数据只显示第一条

SQL SERVER怎么去掉重复数据?

求教sqlserver排除颠倒重复的数据只保留1条

怎样删除EXCEL表重复数据,保留最新的一个

sql语句查询如何显示第一条数据

oracle分页 如何去掉重复数据