Apache Oozie
Posted 单词计数程序大牛
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Apache Oozie相关的知识,希望对你有一定的参考价值。
1. Apache Oozie
Oozie是一个工作流调度系统。Oozie是运行于Java Servlet容器上的一个java web应用。Oozie是按照有向无权图(DAG)调度方式,使用xml文件配置工作流。最初是由Cloudear公司开发,后来贡献给Apache
a. apache Oozie架构
- oozie的webapp:oozie的server
提供一个UI界面,接收客户点的提交的任务,提交给hadoop几圈,启动一个只有一个map没有reduce的mapreduce任务来调度工作的任务具体的执行,交给服务项。
b. 基本原理
采用xml配置工作流
- xml:workflow.xml 配置工作流的具体执行(有向无环图实现到配置文件)。
- job.properties:工作流的通用配置文件,执行参数信息。
将节点分为两类:
- 控制节点:描述工作流的走向 start end fork join kill
- 动作节点:具体执行任务的节点 包括不局限于:mr,java,hive,shell,spark等。
c. 工作流的类型
- workFlow:顺序执行流程节点,普通的工作流的调度,不涉及定时,不涉及批处理的工作流。
- coordinator:支持定时循环的调度任务
- bundle:即支持定时又支持批处理。
以上是关于Apache Oozie的主要内容,如果未能解决你的问题,请参考以下文章