[Hive_add_6] Hive 实现 Word Count

Posted share23

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[Hive_add_6] Hive 实现 Word Count相关的知识,希望对你有一定的参考价值。


 0. 说明

 

 

 


 1. Hive 实现 Word Count 方式一

  1.1 思路

  将每一行文本变为 Array 数组的一个元素

  再通过 collection items terminated by ‘ ‘ 完成转换单行文本

  最后通过表生成函数 explode 分裂 array 数组中的元素变成多行

 

  1.2 实现

  1. 创建表 wc

create table wc(line array<string>) row format delimited collection items terminated by  ;

 

  2. 加载数据

load data local inpath /home/centos/files/wc.txt into table wc;

 

  3. 编写 SQL 语句

select word, count(*) as count from (select explode(line) word from wc ) a group by word order by count desc;

 

 


 

2. Hive 实现 Word Count 方式二

  2.1 思路

  将一行文本加载为 String ,通过 split 结合正则表达书进行拆分

 

 

 

 


 

以上是关于[Hive_add_6] Hive 实现 Word Count的主要内容,如果未能解决你的问题,请参考以下文章

[Hive_add_9] Hive 的存储格式

[Hive_add_8] Hive 常用参数配置

Linux Centos 7 安装 Libreoffice 6.2 实现 word ppt excel 转pdf 教程

[Hive_6] Hive 的内置函数应用

hive例子

Hadoop学习笔记-009-CentOS_6.5_64_HA高可用-Hadoop2.6+Zookeeper3.4.5安装Hive1.1.0