hive--[ arraymapstruct]使用

Posted 楚时邀月

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive--[ arraymapstruct]使用相关的知识,希望对你有一定的参考价值。

复合数据类型

Structs: structs内部的数据可以通过DOT(.)来存取,例如,表中一列c的类型为STRUCT{a INT; b INT},我们可以通过c.a来访问域a
Maps(K-V对):访问指定域可以通过["指定域名称"]进行,例如,一个Map M包含了一个group-》gid的kv对,gid的值可以通过M[‘group‘]来获取
Arrays:array中的数据为相同类型,例如,假如array A中元素[‘a‘,‘b‘,‘c‘],则A[1]的值为‘b‘

 类型  解释  举例
 struct  与c++中的结构体类似,可通过‘.’访问每个域的值,比如Struct{first string,last string},可以通过name.first访问第一个成员  struct(‘john‘,‘doe’)
 map  存储key/value对,可通过[‘key‘]获取每个key的值,比如‘first’-->‘john‘ 可通过name[‘last‘]获取last name。
 map(‘first‘,‘john‘,last,‘doe‘)
 array  同种类型的数据集合,从0开始索引,比如[‘john‘,‘doe‘],可通过name[1]获取doe
 array(‘john‘,‘doe‘)

 

使用实例

1.创建数据表

create table test1.employess1(
name string,
salary FLOAT,
subordinates ARRAY<string>,
deductions MAP<string,FLOAT>,
address STRUCT<stree:string,city:string,state:string,zip:int>)
partitioned by(country string,state string)
row format delimited
  fields terminated by \t
COLLECTION ITEMS TERMINATED BY ,                       
MAP KEYS TERMINATED BY :     
stored as textfile;
  • ‘FIELDS TERMINATED BY‘ :字段与字段之间的分隔符
  • ‘‘COLLECTION ITEMS TERMINATED BY‘ :一个字段各个item的分隔符
  • ‘MAP KEYS TERMINATED BY’ :key value分隔符

2.测试数据

John Doe    10000.0    Mary Sith,Todd Jones    Federal Taxes:0.2,State Taxes:0.1,Insurance:0.1    1 Michigan Ave.,Chicago,IL,60600
Mary Smith    80000.0    Bill King    Federal Taxes:0.2,State Taxes:0.05,Insurance:0.1    100 Ontario St.,Chicago,IL,60601
Todd Jones    70000.0        Federal Taxes:0.15,State Taxes:0.03,Insurance:0.1    200 Chicago Ave.,Oak Park,NY,60700
Bill King    60000.0        Federal Taxes:0.15,State Taxes:0.03,Insurance:0.1    300 Obscure Dr.,Obscur,CA,60100

注意一下字段直接的区分标识和map中key和value的区分标识。

3.查询数据

ARRAY查询:

select subordinates[0] from test1.employess1;

结果:

Mary Sith
Bill King
NULL
NULL

MAP查询:

select deductions[‘Federal Taxes‘] from test1.employess1;

结果:

0.2
0.2
0.15
0.15

查看map中的键值对个数:

select size(deductions) from test1.employess1;

结果:

3
3
3
3

STRUCT查询:

select address.state,address.stree from test1.employess1;

结果:

IL    1 Michigan Ave.
IL    100 Ontario St.
NY    200 Chicago Ave.
CA    300 Obscure Dr.

以上是关于hive--[ arraymapstruct]使用的主要内容,如果未能解决你的问题,请参考以下文章

Hive 入门学习线路指导

大数据技术之_08_Hive学习_01_Hive入门+Hive安装配置和使用+Hive数据类型

hive ----- hive的安装和使用

如何配置hive,使hive能使用spark引擎

如何使用kettle连接hive和hive2

Hive---- Hive基本使用