Pentaho PDI - 从 MongoDB 读取数据

Posted

技术标签:

【中文标题】Pentaho PDI - 从 MongoDB 读取数据【英文标题】:Pentaho PDI - Reading data from MongoDB 【发布时间】:2016-04-12 12:34:53 【问题描述】:

我已经在我的机器上安装了 Pentaho 数据集成版本 (ce-5.0.1.A-stable),我正在尝试使用 PDI 从 MongoDB 检索信息。我用 Mongo Input 步骤创建了一个转换。现在,当我尝试配置我的 MongoDB 连接详细信息时,我找不到 MongoDB 的任何显式连接类型。有人可以建议如何在 Pentaho 中配置 MongoDB 数据源。

我参考了大部分 Pentaho-MongoDb 文档,但没有一个解决方案有效。

另外,我已经尝试执行 Pentaho 官方网站中提到的以下步骤,但我仍然找不到 MongoDB 的任何连接类型

1- 将以下文件夹移出数据集成文件夹结构: 数据集成/插件/pentaho-big-data-plugin

2- 将以下文件移出数据集成文件夹结构(如果存在): 数据集成/libext/JDBC/pentaho-hadoop-hive-jdbc-shim-1.3.0.jar 数据集成/libext/JDBC/pentaho-hadoop-hive-jdbc-shim-1.3.1.jar 数据集成/libext/JDBC/pentaho-hadoop-hive-jdbc-shim-1.3.2.jar

3- 从 data-integration/plugins 文件夹中解压缩文件 pentaho-big-data-plugin-shimtastic-1.3.3.1.zip。

4- (可选)删除 data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations 下的不相关文件夹。

5- 将文件 pentaho-hadoop-hive-jdbc-shim-1.3.3.jar 复制到文件夹中 数据集成/libext/JDBC

6- 将文件 pentaho-instaview-templates-shimtastic-1.3.3.zip 解压到以下目录 数据集成/插件/spoon/agile-bi/platform/pentaho-solutions/system/instaview/templates/Big Data

非常感谢任何帮助..!

【问题讨论】:

【参考方案1】:

Pentaho 没有用于 MongodB 的特定数据库连接。所以你不会在数据库连接查看器中找到它。连接 Mongodb 的方法是在 PDI 中使用 Mongodb Input 步骤。在那里您将找到连接详细信息部分(配置凭据)。然后,您可以连接 JSON 输入 步骤来读取 mongodb 输出的结果。检查以下屏幕截图:

您也可以从 Pentaho Wiki 中的 here 阅读它。虽然文档似乎有点旧,但它是这样做的确切过程。

请注意,您不需要 Bigdata 垫片即可连接到 mongodb。看来您已经配置了 hadoop-hive 垫片。这里不需要。

希望对你有帮助:)

【讨论】:

感谢您提供详细信息。

以上是关于Pentaho PDI - 从 MongoDB 读取数据的主要内容,如果未能解决你的问题,请参考以下文章

在 pentaho PDI 水壶中合并行

Pentaho v8.1 + Hadoop v2.7.4:从 Pentaho PDI 连接到 Hadoop 的问题

Pentaho PDI/Kettle 从文本文件中读取多行

在 Java 上运行 PDI Kettle - Mongodb 步骤缺少插件

Pentaho PDI 存储库连接

Pentaho PDI 中的迁移转换