除了string,boolean,date等基本数据类型之外,hive还支持三种高级数据类型:
1.ARRAY
ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由[‘apple‘,‘orange‘,‘mango‘]组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;
2.MAP
MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist[‘username‘]来得到这个用户对应的password;
3.STRUCT
STRUCT可以包含不同数据类型的元素。类似于一个对象,这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
UNION: UNIONTYPE,他是从Hive 0.7.0开始支持的。
--我们创建一张基于基本数据类型和集合数据类型的表 CREATE TABLE employees ( name STRING, salary FLOAT, subordinates ARRAY<STRING>, deductions MAP<STRING, FLOAT>, address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT> ) PARTITIONED BY (country STRING, state STRING); ROW FORMAT DELIMITED FIELDS TEMINATED BY ‘\001‘ COLLECTION ITEMS TERMINATED BY ‘\002‘ MAP KEYS TEMINATED BY ‘\003‘ LINES TERMINATED BY ‘\n‘ SORTED BY TEXTFILE;
--如果想要查询里面的数据,可以用下面的SQL select name,salary,subordinates[0],deductions[‘key‘],address.city from employees;