hive中count和sum的区别是啥?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive中count和sum的区别是啥?相关的知识,希望对你有一定的参考价值。

参考技术A 首先,sum是对一个字段进行求和,hive中字段的类型一般是string或者int,如果是int当然没问题,如果是string类型但是全部是数字也没问题,如果包含一个字母sum出来将会是0.\\x0d\\x0a假如有这样一张简单的表\\x0d\\x0auser_id stringshop_id string\\x0d\\x0a1234hello\\x0d\\x0a12341234\\x0d\\x0a那\\x0d\\x0a么sum(user_id)的结果是2468,sum(shop_id)的结果是0.如果没有符合条件的记录,sum的返回值将是null,如\\x0d\\x0asum(case when user_id<1000 then shop_id \\x0d\\x0aend)返回值将是null。但某些时候我没希望sum的结果如果没有符合条件的记录就返回0怎么办呢,可以用coalesce(shop_id,0)解\\x0d\\x0a决这个问题。\\x0d\\x0acount是对数据记录的条数进行统计,有一条符合的记录就是1,没有就是0.\\x0d\\x0a\\x0d\\x0a前几天遇到这样一条sql语句,sum(case when\\x0d\\x0asubstr(gmt_receive_pay,0,13)=\'$cur_date $env.last_hourthen t2.total_fee end)\\x0d\\x0aas hour_alipay_fee,\\x0d\\x0a我知道这条语句当没有符合条件的记录时计算出来结果是null,但是我没有意识到这是一个bug,我们要的结果应该是0。检讨一下。

sql中 count(*) 和 count(1)什么区别?

count(*)
可以统计所有的行数,包括为null的行
count(1)
统计的是第一个子字段的行数,为null的行数
不统计。
sql
语句中
有时候1
代表对应的
第一个字段,第二个字段
一次类推。
参考技术A 你建一个表,插入两行记录,一行为1,一行为空,然后你去看看
count(*)

count(1)
发现结果不一样,就知道意思了
参考技术B 聚合函数的参数在不同的函数中代表的意义是不同的:
max(1)中
1:表示为订制1;
sum(1)中
1:表示为行数;
count(1)中
1:表示为所有行,在这里的所有数字都可以看作
*

以上是关于hive中count和sum的区别是啥?的主要内容,如果未能解决你的问题,请参考以下文章

数据库中Count是啥意思和SUM有啥区别

hive和mysql的区别是啥?

聚合case语句中sum和count的区别

数据库里面mysql和hive区别是啥?

SQL sum和count的连接关系

Hive是啥,Hive与关系型数据库的区别