如何在Hive中使用Struct类型
Posted Hadoop实操
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在Hive中使用Struct类型相关的知识,希望对你有一定的参考价值。
温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。
Fayson的github:
提示:代码块部分可以左右滑动查看噢
1.文档编写目的
Hive中支持多种数据类型除了常用的TINYINT、SMALLINT、INT、BIGINT、BOOLEAN、FLOAT、DOUBLE、STRING、BINARY、TIMESTAMP、DECIMAL、DATE、VARCHAR、CHAR类型外,当然还包含一些复杂的数据类型(array、map、struct、union)。本篇文章Fayson主要介绍在Hive中使用Struct类型存储数据。
- 内容概述
1.环境准备
2.创建Hive表及测试
3.总结
- 测试环境
1.CM和CDH版本为5.15
2.环境准备
准备测试数据,文本数据内容如下:
0098.HK,104,2018-10-21T22:20:00.105Z,fayson:男:18
0098.HK,104,2018-10-21T22:20:00.105Z,fayson1:男:19
0098.HK,104,2018-10-21T22:20:00.105Z,fayson2:男:20
0098.HK,104,2018-10-21T22:20:00.105Z,fayson3:男:21
0098.HK,104,2018-10-21T22:20:00.105Z,fayson4:男:22
(可左右滑动)
将准备好的测试数据保存到test.csv文件中,并上传至HDFS的/mdtick/hk/csv目录下。
[root@cdh03 ~]# cat test.csv
[root@cdh03 ~]# hadoop fs -put test.csv /mdtick/hk/csv/
[root@cdh03 ~]# hadoop fs -ls /mdtick/hk/csv/
[root@cdh03 ~]# hadoop fs -cat /mdtick/hk/csv/test.csv
(可左右滑动)
3.创建Hive表
1.使用如下SQL语句创建一个包含Struct类型的表
CREATE EXTERNAL TABLE csvtable2(
symbol string,
tickSequence string,
timeStamp string,
tickdata struct<
name: string,
sex: string,
age: int
>
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ,
collection items terminated by ":"
STORED AS TEXTFILE
LOCATION /mdtick/hk/csv;
(可左右滑动)
如上SQL建表语句中需要注意的是,Struct类型里面定义的为字段的名称与数据类型。Struct类型中定义的字段与示例数据中的“fayson:男:18”是按顺序对应起来的。Collection items terminated by “:”,表示Struct类型数据以“:”分割。
2.使用Hue在Hive中创建测试表
3.使用SQL命令查看csvtable2表数据
4.使用SQL语句查看Struct中数据
4.总结
1.在Hive表中定义Struct类型数据,即在Struct中指定相应的字段名及数据类型即可,多个字段以逗号分隔。
2.使用SQL语句查询Struct中数据方式跟普通的指定字段名方式一样,无需对数据进行特殊处理即可。
3.Struct同样也支持其它类型数据的嵌套,如下:
struct<info:Map<String,String>>
struct<info: struct<name:string>>等
提示:代码块部分可以左右滑动查看噢
为天地立心,为生民立命,为往圣继绝学,为万世开太平。
温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。
推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。
原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操
以上是关于如何在Hive中使用Struct类型的主要内容,如果未能解决你的问题,请参考以下文章