20180604早课记录24-Hive
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了20180604早课记录24-Hive相关的知识,希望对你有一定的参考价值。
1. hive数据分为哪两块?分别存储在哪?元数据和数据本身; mysql等关系型数据库 和 hdfs
2. hive的建表SQL语句你们觉得里有哪些内容?(不光光是字段的定义)
定义分区,分隔字符,内外表之分
3. 默认的换行符和分割符是什么?
/t /r
4. 加载数据或本地数据到hive表或者覆盖hive表,语法是什么?
LOAD DATA LOCAL INPATH ‘xxx‘ OVERWRITE INTO TABLE xxxx;
5.hive的执行引擎是mr,请问哪种hive SQL是触发mr job的
带聚合函数,某些insert,还有create table as select
6. create table a as select * from b; 你们觉得有没有mr job?
有
7. 谈谈你们对分区表的理解? 怎样定义的,怎样加载数据,怎么查询
定义:CREATE TABLE order_created_partition (
order_number string,
event_time string
)
PARTITIONED BY (event_month string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t";
加载数据:LOAD DATA LOCAL INPATH "/tmp/order_created.txt"
OVERWRITE INTO TABLE order_created_partition
PARTITION (event_month=‘2017-12‘);
查询:select * from test1.order_created_partition
where event_month=‘2017-12‘;
8. 静态分区表和动态分区表是什么区别?
静态只能自己手动建立分区表 动态可以设置分区字段然后自动分区
9. 查看函数的是什么语法?
desc function xxx
10. (拓展题)hive一般我们用来做数据插入和追加,不会去更新删除数据,那么hive支持这种操作吗?该加什么参数呢?
支持
以上是关于20180604早课记录24-Hive的主要内容,如果未能解决你的问题,请参考以下文章