Hive查询函数

Posted AOAIYI

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive查询函数相关的知识,希望对你有一定的参考价值。

实验目的:
1、学会使用Hive内置函数
2、学会使用Hive统计分析
Hive的内置数据类型可以分为两大类,分别是基础数据类型和复杂数据类型,Hive基础数据类型如下所示。
一、基础数据类型
数字类型
日期/时间类型
字符串类型
杂项类型
二、复杂数据类型
集合类型

提供一个数据集emp.csv

1.使用Hive创建一个数据库test;

2.创建一张数据表emp_raw,定义id,name,pos,birth,loc,salary字段;

3.将emp.csv加在到表emp_raw;

4.使用复制表语句从表emp_raw复制到表emp,同时将loc字段和salary字段的空值分别赋值为:UNKNOWN,0;

5.查询emp表统计MANAGER、CLERK的人数(结果输出一行);

6.输出emp表到本地文件系统,要求输出3个分区,按pos分区且salary降序;

7.查询emp统计Shanghai、Guangzhou、Guangyuan地区的各个职位的平均薪资(输出字段:地区、职位、平均薪水)

8.查询emp统计每个月份出生的人数(比如2月份就是各年的2月份出生人数总和),打印出生人数前三的月份(输出格式:月份、人数)

9.查询emp统计1970-1-1到1999-12-31之间每一个周出生的人数

10.查询emp统计各个职位薪水前3高的员工信息(TOPN问题,输出格式:姓名、职位、薪水)

以上是关于Hive查询函数的主要内容,如果未能解决你的问题,请参考以下文章

07-SQLSERVER聚合函数

使用 hive udf 函数计算运行总和

第七章 高级查询

Hadoop之Hive查询语句

来自 Hive 中列总和的 MAX 值

查询hive中都有哪些自定义函数