Pentaho PDI 存储库连接

Posted

技术标签:

【中文标题】Pentaho PDI 存储库连接【英文标题】:Pentaho PDI Repository connection 【发布时间】:2016-07-04 11:56:34 【问题描述】:
    您能否解释一下 Pentaho PDI 中不同类型的存储库之间的区别以及拥有这些不同存储库的用途? JNDI 和 OCI 数据库连接向导有什么好处以及如何配置这两者?

提前感谢您的意见。

【问题讨论】:

【参考方案1】:

问题 1: 您有 3 种类型的存储库:文件存储库、数据库存储库和 Pentaho 存储库。

您可以随时从一种存储库格式导出/导入到另一种格式。

文件存储库将转换/作业/连接/等...保存在 xml 文件中。另外两个将它们存储在数据库中,这意味着可以在用户之间共享。 Database (CE) 存储库仅包含最新版本,而 Pentaho (EE) 存储库(您必须为其支付许可证)具有版本控制和其他花哨的东西。

选择哪一个: 对于单个用户,最简单的是文件存储库...除非您想使用 SQL 查询存储库,这在以下情况下可能很有用您突然被置于生产环境中未记录的 ETL 系统前进行迁移、升级、优化或调试。

如果您计划开发人员使用但很少修改其他人编写的转换/作业,请使用数据库存储库。否则,如果您觉得需要版本控制来频繁还原,请使用在 SVN 上共享的文件,例如 github。在这种情况下,其他开发人员将需要下载已提交的修改以保持同步。

当然,如果您的客户有能力通过购买许可证来赞助 OpenSource,请使用 Entreprise 存储库,它为您提供:实时修改和版本控制。

问题 2: 如果您提出这个问题,请使用 JDBC (OCI) 和 kettle.property 中定义的连接参数。 JINI 是一种多用户共享同一连接的技术,表现为集中式服务。在 PDI 的上下文中,几乎没有区别,除非 DBA 以 JINI 或 JDBC 格式为您提供连接凭据。

【讨论】:

以上是关于Pentaho PDI 存储库连接的主要内容,如果未能解决你的问题,请参考以下文章

Pentaho PDI 9(水壶):厨房无法继续,因为无法加载作业

Pentaho PDI - 从 MongoDB 读取数据

Pentaho PDI 中的迁移转换

Pentaho v8.1 + Hadoop v2.7.4:从 Pentaho PDI 连接到 Hadoop 的问题

用于 Rest 客户端的 Pentaho (PDI) 动态授权密钥

使用 Pentaho Kettle/PDI 将行列转换为行