在cm安装的大数据管理平台中集成impala之后读取hive表中的数据的设置(hue当中执行impala的数据查询)

Posted gxg123

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在cm安装的大数据管理平台中集成impala之后读取hive表中的数据的设置(hue当中执行impala的数据查询)相关的知识,希望对你有一定的参考价值。

今天装了CM集群,在集群当中集成了impala,hive。然后一直觉得认为impala自动共享hive的元数据,最后发现好像并不是这样的,需要经过一个同步元数据的操作才能实现数据的同步。

具体的做法如下:

(1)安装好hive和impala,然后在hive当中创建目标数据库,创建一张表

 

[root@VM200-120 ~]# impala-shell  (通过shell的形式进入到impala的命令行当中)

2. 在Impala中同步元数据(这里的元数据是hive当中的元数据)

[VM200-120:21000] > INVALIDATE METADATA;

然后我们去hue的管理界面就可以看到impala当中已经同步了hive当中的数据。可以对数据进行操作了:

 

以上是关于在cm安装的大数据管理平台中集成impala之后读取hive表中的数据的设置(hue当中执行impala的数据查询)的主要内容,如果未能解决你的问题,请参考以下文章

大数据干货基于Hadoop的大数据平台实施——整体架构设计

大数据干货基于Hadoop的大数据平台实施——整体架构设计

Impala查询卡顿分析案例

Impala元数据简介

Impala

Impala