hive如何去掉重复数据,显示第一条
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive如何去掉重复数据,显示第一条相关的知识,希望对你有一定的参考价值。
参考技术A 去重没问题啊,distinct 就好了,显示第一条可以用row_number函数,不同版本hive的row_number有所不同,你自己查一下吧,row_number可以对同一个key从1开始编号的。sql中如何使一列中的多个重复数据只显示第一条
按照左边如果有重复的就取右边的第一个
1、首先在如下图中是一个Student的数据表,这里需要对数据表中的StudentName数据表中的单个的数据进行修改。
2、同样的方法这里首先打开数据库查询语句,输入查询语句先查询一下数据表中的数据内容。
3、输入查询语句,:Select * from Student,输入完毕之后选择全部内容,然后选择执行按钮,执行SQL语句。
4、执行完毕之后,在Student表中的第四行数据(StudentName中的“崔”)这里需要把它修改为“亮亮”,注意这里只要修改的是单个数据,并不是整行数据。
5、在数据表上,用鼠标右击选择里面的“编辑前200行”。
6、编辑完毕之后,就可以在查询表中看到所有数据了,如下图中红线内容。
参考技术Aselect AdviceName,max(authName_1) as authName_1 from table
group by AdviceName
说明:
因为你只选择这1个列作为相同条件列,所以我分组条件就这样写的
因为你要取第一个人名的话,max就OK了
觉得好,就请采纳
追问如果我选择AdviceTime和AdviceName作为相同列的条件,是不是group by 后边要加上AdviceTimene ?
追答select AdviceName,AdviceTime,max(authName_1) as authName_1 from table
group by AdviceName,AdviceTime
像这样,几个相同列条件就加几个
以上是关于hive如何去掉重复数据,显示第一条的主要内容,如果未能解决你的问题,请参考以下文章