Pentaho Kettle 连接到 Hadoop 集群

Posted

技术标签:

【中文标题】Pentaho Kettle 连接到 Hadoop 集群【英文标题】:Pentaho Kettle connect to Hadoop Cluster 【发布时间】:2018-03-08 08:27:52 【问题描述】:

我正在尝试使用在 Windows 10 上运行的 Pentaho 数据集成 (Kettle) 连接到在 Linux 系统上运行的 Hadoop 集群。在测试连接时,我收到以下错误:“Hadoop 文件系统连接 -无法连接到主机名 xxx.xx.xx.xxx。"

【问题讨论】:

您是否点击了“了解更多”?它说什么?它试图建立什么样的联系?你没有提供端口号 【参考方案1】:

你解决了吗? 我将四个 Hadoop conf 文件复制到..\pentaho\pdi-ce-8.2.0.0-342\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp26:

core-site.xml yarn-site.xml mapred-site.xml hdfs-site.xml

并检查 Hadoop 集群的 hostname/IPaddr 和端口。

【讨论】:

以上是关于Pentaho Kettle 连接到 Hadoop 集群的主要内容,如果未能解决你的问题,请参考以下文章

Pentaho v8.1 + Hadoop v2.7.4:从 Pentaho PDI 连接到 Hadoop 的问题

pentaho水壶无法连接到cloudera cdh4 HDFS

如何动态传递数据库连接属性以连接到 pentaho 中的不同数据库

kettle连接hadoop配置hdfs文件数据导出

kettle6.1 连接hadoop2.6.0-CDH5.5.0

Pentaho Kettle 6.1连接CDH5.4.0集群