flink双流join
Posted jj1106
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了flink双流join相关的知识,希望对你有一定的参考价值。
一. 基本概念(https://blog.csdn.net/xianzhen376/article/details/89810958)
双流Join是Flink面试的高频问题。一般情况下说明以下几点就可以hold了:
1.join大体分类有两种:window join和interval join。window join又可以根据window的类型细分为3种,如下:
Tumbling Window join、Sliding Window join、Session Window Join。
2. windows类型的join都是利用window的机制,先将数据缓存在window state中,当窗口触发计算时,执行join
3. interval join也是利用state存储数据再处理,区别在于state中的数据有失效机制,依靠数据触发数据清理;
4. 目前Stream join的结果是数据的笛卡尔积;
5. 日常使用中的一些问题,数据延迟、window序列化相关。
二. 双流join与传统数据库表join的区别
以上是关于flink双流join的主要内容,如果未能解决你的问题,请参考以下文章
面试官: Flink双流JOIN了解吗? 简单说说其实现原理
2021年大数据Flink(四十五):扩展阅读 双流Join