Hive查询函数
Posted AOAIYI
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive查询函数相关的知识,希望对你有一定的参考价值。
实验目的:
1、学会使用Hive内置函数
2、学会使用Hive统计分析
Hive的内置数据类型可以分为两大类,分别是基础数据类型和复杂数据类型,Hive基础数据类型如下所示。
一、基础数据类型
数字类型
日期/时间类型
字符串类型
杂项类型
二、复杂数据类型
集合类型
提供一个数据集emp.csv
1.使用Hive创建一个数据库test;
2.创建一张数据表emp_raw,定义id,name,pos,birth,loc,salary字段;
3.将emp.csv加在到表emp_raw;
4.使用复制表语句从表emp_raw复制到表emp,同时将loc字段和salary字段的空值分别赋值为:UNKNOWN,0;
5.查询emp表统计MANAGER、CLERK的人数(结果输出一行);
6.输出emp表到本地文件系统,要求输出3个分区,按pos分区且salary降序;
7.查询emp统计Shanghai、Guangzhou、Guangyuan地区的各个职位的平均薪资(输出字段:地区、职位、平均薪水)
8.查询emp统计每个月份出生的人数(比如2月份就是各年的2月份出生人数总和),打印出生人数前三的月份(输出格式:月份、人数)
9.查询emp统计1970-1-1到1999-12-31之间每一个周出生的人数
10.查询emp统计各个职位薪水前3高的员工信息(TOPN问题,输出格式:姓名、职位、薪水)
以上是关于Hive查询函数的主要内容,如果未能解决你的问题,请参考以下文章