数据集成 ETL 与 Java Web 应用程序?
Posted
技术标签:
【中文标题】数据集成 ETL 与 Java Web 应用程序?【英文标题】:Data integration ETL with java web application? 【发布时间】:2016-02-03 11:19:25 【问题描述】:我是 商业智能 的新手,我打算开发一个 java web 应用程序。
我想integrate
来自不同来源的数据,这样我就可以将它们存储在数据库中。
是否有 API 或 pentaho 或 talend 罐或其他 ETLs
我可以添加到我的应用程序中来做到这一点?
或者我该怎么办??
提前谢谢:)
【问题讨论】:
【参考方案1】:如果您想使用 Pentaho Data Integration (Kettle),您可以按照以下说明进行操作: http://pentaho-bi-suite.blogspot.cz/2015/03/kettle-etl-basics-5-command-line.html
它指导您在 Kettle 中开发 ETL 作业,然后安排它。 ETL 作业是在Pentaho Data Integration 工具中开发的。可以从各种来源(数据库、文件等)加载数据,对其进行转换并加载到目标数据库。
这样,ETL 就不是 Java Web 应用程序的一部分。它只是作为一个单独的应用程序共存。
【讨论】:
感谢您的回复 :) 但是你知道是否有一个免费的 API 或库可以让我在我的 Web 应用程序中进行数据集成吗?? 那么,您想将ETL工具的核心功能集成到您的应用程序中吗? Spoon (Pentaho ETL) 是为不熟悉 java 编程的用户设计的。 Pentaho ETL 最强大的功能是开箱即用的转换/作业和集群的可视化设计器。它带有很多你根本不需要的功能。如果你有东西但不使用它 - 这只是浪费内存。当您谈到“数据集成”时,这是一个非常常见的问题。在不知道您想要什么确切集成的情况下,很难推荐任何工具最好的灵丹妙药。 是的,Pentaho 有一个完整的 Java API,但我会考虑你是否真的需要这样做,尤其是使用 Kettle Thin JDBC 驱动程序。这是Kettle API Docs。【参考方案2】:你可以用这个https://github.com/rodrifmed/pentaho-data-integration
在这个 repo 中有一个使用示例和一个简单的 pentaho 的 java api 包装器
【讨论】:
以上是关于数据集成 ETL 与 Java Web 应用程序?的主要内容,如果未能解决你的问题,请参考以下文章
「集成架构」ETL工具大比拼:Talend vs Pentaho