Cloudera RImpala 连接不工作

Posted

技术标签:

【中文标题】Cloudera RImpala 连接不工作【英文标题】:Cloudera RImpala connection not working 【发布时间】:2016-07-25 22:56:00 【问题描述】:

我正在尝试在 AWS 上使用 R 连接到运行 Cloudera hadoop 的集群。按照这里提到的步骤 - http://blog.cloudera.com/blog/2013/12/how-to-do-statistical-analysis-with-impala-and-r/

到目前为止,我可以启动 jdbc 驱动程序,但无法连接到 impala。

.

通过一些调查,我可以看到 impala 守护程序正在我们所有的工作节点中运行。端口是这样配置的。

另外,我登录到其中一个工作节点并检查了正在侦听的端口。我可以看到 21050 端口正在监听,这里是,

在 rimpala connect 中,我使用的是工作节点的公共 IP。仍然无法连接到那个。我可以使用公共 IP 和端口 25000 来查看 impala Web UI,但无法连接到该端口侦听 jdbc 请求。任何人都可以帮助我吗?

【问题讨论】:

【参考方案1】:

如果有人在寻求帮助,这是我从 Cloudera 支持人员那里得到的答案。

“问题不在于 Impala 或 Cloudera 发行版。问题在于 与“Rimpala”正在使用的驱动程序一起使用。 Rimapla 正在使用 HIVE JDBC 司机。如果您在以下位置查看源代码 https://github.com/Mu-Sigma/RImpala/blob/master/java/src/main/java/com/musigma/ird/bigdata/RImpala.java 您会看到用作驱动器的调用是 “org.apache.hive.jdbc.HiveDriver”。所以理想的 RImpala 包是 已过时且未更新以正常工作。”

【讨论】:

以上是关于Cloudera RImpala 连接不工作的主要内容,如果未能解决你的问题,请参考以下文章

连接 R 和 Impala

在 R 中使用 rimpala 将插入插入到查询中

Hadoop 王者 Cloudera 新转型,定位为混合数据公司

在 Cloudera 中外部化 Oozie 工作流的属性

hue添加水印功能

Java cloudera impala 连接不稳定:使用 [Simba][ImpalaJDBCDriver](500151) 错误设置/关闭会话:0