如何用 pycharm 调试 airflow

Posted fangxuanlang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用 pycharm 调试 airflow相关的知识,希望对你有一定的参考价值。

airflow 和 pycharm 相关基础知识请看其他博客

 

我们在使用 airflow的 dag时。 每次写完不知道对不对的,总不能到页面环境中跑一下,等到报错再调试吧。这是很让人恼火的事情

这里我想分享  如何用 pycharm 对 airflow 进行调试

 

airflow的运行环境,依赖于  airflow.cfg和  airflow_home,

pycharm 的项目目录应该和 airflow_home 相同目录。

 

1.  airflow的配置 

详细配置看请看其他博客,这里只是表名我的  airflow_home   = /data/airflow

[core]

dags_folder = /data/airflow/dags

# The folder where airflow should store its log files
# This path must be absolute
base_log_folder = /data/airflow/logs

plugins_folder = /data/airflow/plugins

sql_alchemy_conn =  mysql://airflow:airflow@IP:3306/airflowtest

broker_url = sqla+mysql://airflow:airflow@IP:3306/airflowtest

 

2. 启动webserver 模式下airflow

airflow webserver -D

airflow  scheduler -D 

airflow  workder -D 

技术图片

 

 

3. 在/data/airflow/dags 下新建范例  dag

 vim hello_world.py 

from datetime import datetime
from airflow import DAG
from airflow.operators.dummy_operator import DummyOperator
from airflow.operators.python_operator import PythonOperator


def print_hello():
     print (hello my name is fanglianchao)
     return Hello world!


dag = DAG(hello_world, description=Simple tutorial DAG,
          schedule_interval=0 12 * * *,
          start_date=datetime(2017, 3, 20), catchup=False)

dummy_operator = DummyOperator(task_id=dummy_task, retries=3, dag=dag)

hello_operator = PythonOperator(task_id=hello_task, python_callable=print_hello, dag=dag)

dummy_operator >> hello_operator
~                                

4.执行测试:

如果以下测试成功,就代表安装成功了, 可以到 web 里面  触发执行看看

 airflow test hello_world hello_task 2019-10-10

技术图片

 

 技术图片

 

 

 

5. pycharm 项目配置

技术图片

 

 执行这个dag 

技术图片

 

 编辑这个dag 配置文件

技术图片

 

 技术图片

 

技术图片

 

 技术图片

 

 

 技术图片

以上是关于如何用 pycharm 调试 airflow的主要内容,如果未能解决你的问题,请参考以下文章

如何用pycharm来调试odoo

如何用pycharm编写获取时间的代码

如何用pycharm查看文件修改记录和对比分支差异

如何用matlab绘制三维地形图

Ubuntu 系统如何用pycharm开发python—OpenCV

pycharm 注册码如何用