在flink中哪个是基于批处理的图计算库

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在flink中哪个是基于批处理的图计算库相关的知识,希望对你有一定的参考价值。

参考技术A

在flink中Gelly是基于批处理的图计算库

作为分布式数据处理框架,Flink同时提供了支撑计算和批计算的接口,同时在此基础上抽象出不同的应用类型的组件库,如基于流处理的CEP(复杂事件处理库)、SQL&Table库和基于批处理的FlinkML(机器学习库)等、Gelly(图处理库)等。

API层包括构建流计算应用的DataStream API和批计算应用的DataSet API,两者都提供给用户丰富的数据处理高级API,例如Map、FlatMap操作等,同时也提供比较低级的Process Function API,用户可以直接操作状态和时间等底层数据。

Flink

Flink通过实现Google Dataflow流式计算模型实现了高吞吐、低延迟、高性能兼具实时流式计算框架。同时Flink支持高度容错的状态管理,防止状态在计算过程中因为系统异常而出现丢失,Flink周期性地通过分布式快照技术Checkpoints实现状态的持久化维护,使得即使在系统停机或者异常的情况下都能计算出正确的结果。

以上是关于在flink中哪个是基于批处理的图计算库的主要内容,如果未能解决你的问题,请参考以下文章

Spark(24)——spark与flink的区别

Flink 事件时间与处理时间

Flink 事件时间与处理时间

Flink了解、生态

flink和spark对比

基于Flink流处理的动态实时超大规模用户行为分析