Kettl:Kettle is an acronym for "Kettle E.T.T.L.Emvironment". This means it has been designed to help you with your ETTL needs: the Extraction, Transformation, Transformation and Loading of data.
Pentaho Data Integration(Kettle) 是一款开源的ETL(Extract Transformation Load)工具,用来完成数据的抽取,清洗、转换和加载等数据处理方面的工作。
特点:
流程式设计方便易用
全面的数据访问支持
支持多平台
插件架构扩展性好
商业/社区支持
多种方式应用集成
全面优化高效稳定
Kettle vs Informatica:
相似点:
?Pentaho 和 Informatica 都提供了大量的转换步骤、脚本功能,都 可以处理复杂的ETL 转换。
?通常情况下 Informatica 比 Kettle 更快。Informatica 有下推优化, 缓存查询等提高性能的手段。但是如果你对 Kettle 和数据库有足够 的了解,做一些调整,你可以提高 Kettle 的速度,在一些情况下可 以达到甚至超过 Informatica 的速度。 Kettle 的优点:
?Kettle 的易用性比 Informatica 好,需要的培训要少很多。
?Kettle 不需要像 Informatica 那样大的前期投入。
?Kettle 的插件架构支持快速定制开发
Informatica 的优点:
?Informatica 的错误报告功能比 Kettle 更友好,更容易定位错误。 Kettle 通常只把异常抛出,需要实施人员有更丰富的经验。
?Informatica 比 Kettle 有更好的监控工具和负载均衡等企业级应用 功能,更适合大规模的ETL 应用。。