春云数据流和气流

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了春云数据流和气流相关的知识,希望对你有一定的参考价值。

我们有airflow作为工作流管理工具来调度监控任务,也有一些有应用使用Spring云数据流,通过生产者和消费者对话消息总线Kafka和Grafana仪表盘的UI(ETL)进行跨流程松散耦合。Kubernetes和AWS(EKS)是部署的选择。

我们正在开始创建数据管道,这将有源(S3或服务器或数据库上的文件),处理器(自定义应用程序,ALML管道)和目的地(Kafka,s3,数据库,ES)。我计划使用airflow来管理管道的整体管理和管道内的任务,通过基于SCDF的应用程序或未来的应用程序编写的python随着ALML的扩展。这样的做法正确吗,或者说我可以舍弃一个而放弃另一个吗?

答案

根据你的要求,SCDF将适合并提供选项来管理你的流式数据管道。虽然你仍然可以研究找到任何其他可能的方法,但我可以提供一些更多的提示,说明SCDF提供了什么来满足你的一些要求。

  • SCDF提供了开箱即用的应用程序,你可以对其进行扩展定制。这些应用程序包括S3源和汇,你可以使用开箱即用。关于完整的开箱即用的应用程序列表,您可以参考以下页面 此处
  • 显然,SCDF有Kubernetes部署器,你可以在任何基于Kubernetes的平台上工作。你可以在部署应用时,将你的K8s特定属性配置为一组kubernetes部署器属性。
  • 你可以在流式数据管道中嵌入一个基于python的应用程序作为处理器transformer。你可以检查这个 收据 从SCDF网站了解更多信息。
  • 您也可以嵌入 tensorflow 应用作为 处理器 管道内的应用。

以上是关于春云数据流和气流的主要内容,如果未能解决你的问题,请参考以下文章

春云侧车hystrix超时不火

春云流卡夫卡

部署气流代码库

如何将数据帧传递到气流任务的临时表中

春云侦探是如何工作的?

春云 |假装Hytrix |首次通话超时