AirFlow 作业管理学习

Posted 杨江

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AirFlow 作业管理学习相关的知识,希望对你有一定的参考价值。

Linux环境(或者Windows下的Linux环境,Windows环境有问题 termios或者  pwd 插件安装不了)

创建项目目录,创建Python虚拟环境
mkdir -p ~/airflow
cd airflow
python3 -m venv myvenv
. myvenv/bin/activate
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
参考:https://mirrors.tuna.tsinghua.edu.cn/help/pypi/

安装AirFlow
export AIRFLOW_HOME=~/airflow
export SLUGIFY_USES_TEXT_UNIDECODE=yes
pip install apache-airflow
 
初始化AirFlow数据库(SQLLite数据库)
# initialize the database
airflow db init
 
# start the web server, default port is 8080
airflow webserver -p 8082 &
 
# start the scheduler
airflow scheduler &

# 创建用户
参考:
https://airflow.apache.org/docs/apache-airflow/stable/start/local.html
airflow users create \\
    --username admin \\
    --firstname Peter \\
    --lastname Parker \\
    --role Admin \\
    --email spiderman@superhero.org
    
http://192.168.1.4:8082/
DAG Import Errors (2)
Do not use SQLite as metadata DB in production – it should only be used for dev/testing We recommend using Postgres or mysql. Click here for more information.
Do not use SequentialExecutor in production. Click here for more information.

网上老的写法例子不能用
2.0 新的写法:
with DAg()
as dag;

重点:
dags 目录 例子代码(博士)
例子代码 localhost:8080查看
api查看测试 http://localhost:8080/api/v1/users
Firefox安装 扩展:RESTED(A REST client for the rest of us),进行API测试

参考:
Airflow Python工作流引擎的重要概念介绍
https://blog.csdn.net/watermelonbig/article/details/82585196

以上是关于AirFlow 作业管理学习的主要内容,如果未能解决你的问题,请参考以下文章

Airflow简单介绍及测试安装

2016-10-5 linux基础学习——进程及作业管理

Python学习笔记——进阶篇第八周———FTP断点续传作业&批量主机管理工具

管理 AirFlow 方法

supervisor管理airflow

工作流管理平台Airflow