Airflow 中文文档:用Dask扩展

Posted wizardforcel

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Airflow 中文文档:用Dask扩展相关的知识,希望对你有一定的参考价值。

DaskExecutor允许您在Dask分布式群集中运行Airflow任务。

Dask集群可以在单个机器上运行,也可以在远程网络上运行。 有关完整详细信息,请参阅分布式文档 。

要创建集群,首先启动调度程序:

 # default settings for a local cluster
DASK_HOST = 127 .0.0.1
DASK_PORT = 8786

dask-scheduler --host $DASK_HOST --port $DASK_PORT

接下来,在任何可以连接到主机的计算机上启动至少一个Worker:

dask-worker $DASK_HOST : $DASK_PORT

阅读全文/改进本文

以上是关于Airflow 中文文档:用Dask扩展的主要内容,如果未能解决你的问题,请参考以下文章

Airflow 中文文档:保护连接

Airflow 中文文档:用Celery扩大规模

Airflow 中文文档:使用测试模式配置

Airflow 中文文档:使用Mesos扩展(社区贡献)

Dask:我如何将我的代码与 dask 延迟并行化?

(Django)气流中的 ORM - 有可能吗?