hadoop之hive集合数据类型

Posted Mars.wang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hadoop之hive集合数据类型相关的知识,希望对你有一定的参考价值。

除了string,boolean,date等基本数据类型之外,hive还支持三种高级数据类型:

1.ARRAY

ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由[‘apple‘,‘orange‘,‘mango‘]组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;


2.MAP

MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist[‘username‘]来得到这个用户对应的password;

3.STRUCT

STRUCT可以包含不同数据类型的元素。类似于一个对象,这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
UNION: UNIONTYPE,他是从Hive 0.7.0开始支持的。

--我们创建一张基于基本数据类型和集合数据类型的表
CREATE TABLE employees (  
    name STRING,  
    salary FLOAT,  
    subordinates ARRAY<STRING>,  
    deductions MAP<STRING, FLOAT>,  
    address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>  
) PARTITIONED BY (country STRING, state STRING);
ROW FORMAT DELIMITED
FIELDS TEMINATED BY \001
COLLECTION ITEMS TERMINATED BY \002
MAP KEYS TEMINATED BY \003
LINES TERMINATED BY \n
SORTED BY TEXTFILE;
--如果想要查询里面的数据,可以用下面的SQL

select name,salary,subordinates[0],deductions[‘key‘],address.city from employees;

 



以上是关于hadoop之hive集合数据类型的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop生态之Hive

Hive编程指南学习02

hadoop生态之hive

Hadoop整理五(基于Hadoop的数据仓库Hive)

打怪升级之小白的大数据之旅(六十二)<Hive旅程第三站:Hive数据类型>

打怪升级之小白的大数据之旅(六十二)<Hive旅程第三站:Hive数据类型>