Flink从入门到精通100篇(二十一)-Apache Flink 与 Apache Hive 的集成

Posted 文宇肃然

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flink从入门到精通100篇(二十一)-Apache Flink 与 Apache Hive 的集成相关的知识,希望对你有一定的参考价值。

前言

随着 Flink 在流式计算的应用场景逐渐成熟和流行。如果 Flink 能同时把批量计算的应用场景处理好,就能减少用户在使用 Flink 的开发和维护成本,并且能够丰富 Flink 的生态。因为 SQL 是批计算比较常用的工具,所以 Flink 针对于批计算主要以 SQL 为主要接口。本次分享主要针对 Flink 对批处理的设计与 Hive 的集成。

主要分为下面三点展开:

  • 设计架构

  • 项目进展

  • 性能测试

首先和大家分享一下 Flink 批处理的设计架构。

1. 背景

Flink 提升批处理的主要原因,是为了减少客户的维护成本和更新成本,还有更好的完善 Flink 生态环

以上是关于Flink从入门到精通100篇(二十一)-Apache Flink 与 Apache Hive 的集成的主要内容,如果未能解决你的问题,请参考以下文章

Flink从入门到精通100篇(二十一)-Flink 状态(State)管理在推荐场景中的应用

Flink从入门到精通100篇(二十四)-对Flink SQL Client 源码做深度解析

Flink从入门到精通100篇(二十三)-Flink实战应用案例:如何清理过期的 Checkpoint 目录?

Flink从入门到精通100篇(二十二)-Apache Flink OLAP引擎性能优化及应用

Flink从入门到精通100篇(二十三)-Apache Flink在滴滴的应用与实践

Flink从入门到精通100篇(二十)-跨境电商 Shopee 的实时数仓之路