FlinkTableSql API 笔记:Row和RowData

Posted yannbai08

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了FlinkTableSql API 笔记:Row和RowData相关的知识,希望对你有一定的参考价值。

 根据个人理解整理,大佬们有更好的想法可以评论

  • Row

首先,Row是一种固定长度、可识别空值的复合类型,使用确定的字段顺序存储多个值。 无论字段的类型如何,每个字段都可以为空。 无法自动推断行字段的类型; 因此,无论何时生成一行,都需要提供类型信息。
Row 的主要目的是在 Flink 的 Table 和 SQL 生态系统以及其他 API 之间架起一座桥梁。 因此,行不仅由模式部分(包含字段)组成,而且还附加了一个 RowKind 用于对更改日志中的更改进行编码。 因此,可以将一行视为更改日志中的一个条目。 例如,在常规批处理方案中,更改日志将包含 RowKind.INSERT 行的有界流。 行种类与字段分开,可以使用 getKind() 和 setKind(RowKind) 访问。

Row有三种模式:

Position-based field mode:根据位置设置field

Name-based field mode:根据fieldName设置

Hybrid / named-position field mode:混合模式

  • RowData

首先,RowData是一个接口噢,有很多基于接口的实现,其中可以看下GenericRowData的构造函数,基本就明白了,传入rowKind以及参数个数。RowData是在运行时通过 Table API 或 SQL 管道传输的所有顶级接口。

  private final Object[] fields;
  private RowKind kind;

  public GenericRowData(RowKind kind, int arity) 
    this.fields = new Object[arity];
    this.kind = kind;
  

所以总结下来可以这样理解,Row为RowData的低阶数据类型,常常用于DataStream中的使用;而RowData是通过不同的Conveter转换Row得到的高阶数据,用于TableAPI和Sql中使用 ;两者中的存储内容基本是一致的。

以上是关于FlinkTableSql API 笔记:Row和RowData的主要内容,如果未能解决你的问题,请参考以下文章

如何使用来自另一个 Dataset<Row> 的记录更新 Dataset<Row>,这些记录在 Spark 中使用 JAVA API 具有相同的模式?

leetcode笔记:Range Sum Query 2D - Immutable

google 地方文本搜索 api 没有响应

UIScrollView笔记

pdo学习笔记

Bootstrap5相对于4的个人更新笔记