apache气流中BeamRunPythonPipelineOperator和DataFlowPythonOperator的区别

Posted

技术标签:

【中文标题】apache气流中BeamRunPythonPipelineOperator和DataFlowPythonOperator的区别【英文标题】:Difference between BeamRunPythonPipelineOperator and DataFlowPythonOperator in apache airflow 【发布时间】:2022-01-21 23:19:43 【问题描述】:

我正在尝试在 Airflow 中运行一个执行数据流作业的作业。我意识到有 2 个运算符,即 BeamRunPythonPipelineOperator 和 DataFlowPythonOperator,这两个运算符都可以将作业提交到数据流,但我担心它们之间的区别。 它们之间有什么区别吗?请帮我。任何帮助将不胜感激?

【问题讨论】:

【参考方案1】:

一般:

    DataFlowPythonOperator 类已弃用,建议改用DataflowCreatePythonJobOperatorDataflowCreatePythonJobOperator 类已弃用,建议改用BeamRunPythonPipelineOperator

【讨论】:

以上是关于apache气流中BeamRunPythonPipelineOperator和DataFlowPythonOperator的区别的主要内容,如果未能解决你的问题,请参考以下文章

使用 Apache 气流存储和访问密码

如何使用apache气流调度谷歌云bigquery存储过程

GCP apache气流,如何从私有存储库安装Python依赖项

以编程方式在 dockerized apache 气流 python 操作符内创建 SSH 隧道

启用 API 身份验证时,Apache 气流 REST API 调用失败并出现 403 禁止

气流添加谷歌云连接