数据集成 ETL 与 Java Web 应用程序?

Posted

技术标签:

【中文标题】数据集成 ETL 与 Java Web 应用程序?【英文标题】:Data integration ETL with java web application? 【发布时间】:2016-02-03 11:19:25 【问题描述】:

我是 商业智能 的新手,我打算开发一个 java web 应用程序。 我想integrate 来自不同来源的数据,这样我就可以将它们存储在数据库中。 是否有 API 或 pentaho 或 talend 罐或其他 ETLs 我可以添加到我的应用程序中来做到这一点? 或者我该怎么办??

提前谢谢:)

【问题讨论】:

【参考方案1】:

如果您想使用 Pentaho Data Integration (Kettle),您可以按照以下说明进行操作: http://pentaho-bi-suite.blogspot.cz/2015/03/kettle-etl-basics-5-command-line.html

它指导您在 Kettle 中开发 ETL 作业,然后安排它。 ETL 作业是在Pentaho Data Integration 工具中开发的。可以从各种来源(数据库、文件等)加载数据,对其进行转换并加载到目标数据库。

这样,ETL 就不是 Java Web 应用程序的一部分。它只是作为一个单独的应用程序共存。

【讨论】:

感谢您的回复 :) 但是你知道是否有一个免费的 API 或库可以让我在我的 Web 应用程序中进行数据集成吗?? 那么,您想将ETL工具的核心功能集成到您的应用程序中吗? Spoon (Pentaho ETL) 是为不熟悉 java 编程的用户设计的。 Pentaho ETL 最强大的功能是开箱即用的转换/作业和集群的可视化设计器。它带有很多你根本不需要的功能。如果你有东西但不使用它 - 这只是浪费内存。当您谈到“数据集成”时,这是一个非常常见的问题。在不知道您想要什么确切集成的情况下,很难推荐任何工具最好的灵丹妙药。 是的,Pentaho 有一个完整的 Java API,但我会考虑你是否真的需要这样做,尤其是使用 Kettle Thin JDBC 驱动程序。这是Kettle API Docs。【参考方案2】:

你可以用这个https://github.com/rodrifmed/pentaho-data-integration

在这个 repo 中有一个使用示例和一个简单的 pentaho 的 java api 包装器

【讨论】:

以上是关于数据集成 ETL 与 Java Web 应用程序?的主要内容,如果未能解决你的问题,请参考以下文章

「集成架构」ETL工具大比拼:Talend vs Pentaho

与 Paypal 集成的 Java Web 应用程序

数据仓库建模与ETL实践技巧

从ETL走向EtLT架构,下一代数据集成平台Apache SeaTunnel核心设计思路解析

创建Web表单并与数据库集成吗?

使用 Spring Batch 实现 ETL