[Hive_add_6] Hive 实现 Word Count
Posted share23
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[Hive_add_6] Hive 实现 Word Count相关的知识,希望对你有一定的参考价值。
0. 说明
1. Hive 实现 Word Count 方式一
1.1 思路
将每一行文本变为 Array 数组的一个元素
再通过 collection items terminated by ‘ ‘ 完成转换单行文本
最后通过表生成函数 explode 分裂 array 数组中的元素变成多行
1.2 实现
1. 创建表 wc
create table wc(line array<string>) row format delimited collection items terminated by ‘ ‘;
2. 加载数据
load data local inpath ‘/home/centos/files/wc.txt‘ into table wc;
3. 编写 SQL 语句
select word, count(*) as count from (select explode(line) word from wc ) a group by word order by count desc;
2. Hive 实现 Word Count 方式二
2.1 思路
将一行文本加载为 String ,通过 split 结合正则表达书进行拆分
以上是关于[Hive_add_6] Hive 实现 Word Count的主要内容,如果未能解决你的问题,请参考以下文章
Linux Centos 7 安装 Libreoffice 6.2 实现 word ppt excel 转pdf 教程
Hadoop学习笔记-009-CentOS_6.5_64_HA高可用-Hadoop2.6+Zookeeper3.4.5安装Hive1.1.0