Pentaho PDI - 从 MongoDB 读取数据
Posted
技术标签:
【中文标题】Pentaho PDI - 从 MongoDB 读取数据【英文标题】:Pentaho PDI - Reading data from MongoDB 【发布时间】:2016-04-12 12:34:53 【问题描述】:我已经在我的机器上安装了 Pentaho 数据集成版本 (ce-5.0.1.A-stable),我正在尝试使用 PDI 从 MongoDB 检索信息。我用 Mongo Input 步骤创建了一个转换。现在,当我尝试配置我的 MongoDB 连接详细信息时,我找不到 MongoDB 的任何显式连接类型。有人可以建议如何在 Pentaho 中配置 MongoDB 数据源。
我参考了大部分 Pentaho-MongoDb 文档,但没有一个解决方案有效。
另外,我已经尝试执行 Pentaho 官方网站中提到的以下步骤,但我仍然找不到 MongoDB 的任何连接类型
1- 将以下文件夹移出数据集成文件夹结构: 数据集成/插件/pentaho-big-data-plugin
2- 将以下文件移出数据集成文件夹结构(如果存在): 数据集成/libext/JDBC/pentaho-hadoop-hive-jdbc-shim-1.3.0.jar 数据集成/libext/JDBC/pentaho-hadoop-hive-jdbc-shim-1.3.1.jar 数据集成/libext/JDBC/pentaho-hadoop-hive-jdbc-shim-1.3.2.jar
3- 从 data-integration/plugins 文件夹中解压缩文件 pentaho-big-data-plugin-shimtastic-1.3.3.1.zip。
4- (可选)删除 data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations 下的不相关文件夹。
5- 将文件 pentaho-hadoop-hive-jdbc-shim-1.3.3.jar 复制到文件夹中 数据集成/libext/JDBC
6- 将文件 pentaho-instaview-templates-shimtastic-1.3.3.zip 解压到以下目录 数据集成/插件/spoon/agile-bi/platform/pentaho-solutions/system/instaview/templates/Big Data
非常感谢任何帮助..!
【问题讨论】:
【参考方案1】:Pentaho 没有用于 MongodB 的特定数据库连接。所以你不会在数据库连接查看器中找到它。连接 Mongodb 的方法是在 PDI 中使用 Mongodb Input 步骤。在那里您将找到连接详细信息部分(配置凭据)。然后,您可以连接 JSON 输入 步骤来读取 mongodb 输出的结果。检查以下屏幕截图:
您也可以从 Pentaho Wiki 中的 here 阅读它。虽然文档似乎有点旧,但它是这样做的确切过程。
请注意,您不需要 Bigdata 垫片即可连接到 mongodb。看来您已经配置了 hadoop-hive 垫片。这里不需要。
希望对你有帮助:)
【讨论】:
感谢您提供详细信息。以上是关于Pentaho PDI - 从 MongoDB 读取数据的主要内容,如果未能解决你的问题,请参考以下文章
Pentaho v8.1 + Hadoop v2.7.4:从 Pentaho PDI 连接到 Hadoop 的问题