kettle中跑transformation和job的区别

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了kettle中跑transformation和job的区别相关的知识,希望对你有一定的参考价值。

第一个区别,Job(作业)是步骤流,transformation(转换)是数据流。这是作业和转换最大的区别。

第二个区别,Job的每一个步骤,必须等到前面的步骤都跑完了,后面的步骤才会执行。transformation会一次性把所有控件全部先启动(一个控件对应启动一个线程),然后数据流会从第一个控件开始,一条记录、一条记录地流向最后的控件;

第三个区别,控件的区别。

作业的控件都是完成了一项单独的工作,并不需要很细致地指定一条条记录如何处理。

转换的控件针对的都是每行记录、每个字段进行处理,必须要有输入 -> 输出,以输入控件开始,以输出控件结束。

扩展资料:

作业和转换的嵌套关系

作业可以调另一个作业(用General->Job控件),强调的是父作业与子作业。

作业可以调一个转换(用General->Transformation控件),强调的是其中一个步骤。

转换可以调一个作业(用Flow->Job Executor控件),执行结果会变成数据流里的新的一列数据,强调的是执行结果。

转换可以调另一个转换(用Flow->Transformation Executor控件),执行结果会变成数据流里的新的一列数据,强调的是执行结果。

参考资料:百度百科-Kettle

参考技术A job可以用来调用多个交换,然后设置频率定时跑吧,目前我用到的就是这样的,其他的还没去研究。

以上是关于kettle中跑transformation和job的区别的主要内容,如果未能解决你的问题,请参考以下文章

kettle使用配置

Kettle transformation 操作内容快速查询

Kettle数据同步和抽取

Kettle(Pentaho)实现web方式远程执行job或transformation

kettle-学习参考

自己总结的etl数挖掘据工具-Kettle