Flink学习:Flink支持的数据类型

Posted 我爱夜来香A

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flink学习:Flink支持的数据类型相关的知识,希望对你有一定的参考价值。

Flink

Flink支持非常完善的数据类型,数据类型的描述信息都是由TypeInformation定义,比较常用的TypeInformation有BasicTypeInfo、TupleTypeInfo、CaseClassTypeInfo、PojoTypeInfo等。

一、原生数据类型

1、BasicTypeInfo

//创建Int类型的数据集
val env = StreamExecutionEnvironment.getExecutionEnvironment
val IntStream:DataStream[Int] = env.fromElements(4,51,2,7)
//创建String类型的数据集
val StringStream:DataStream[String] = env.fromElements("hello","flink")

2、BasicArrayTypeInfo

//通过从数组中创建数据集
val ArrayStream:DataStream[Int] = env.fromCollection(Array(8,5,2,31))
//通过List集合创建数据集
val ListStream:DataStream[Int] = env.fromCollection(List(6,23,63,9))

二、Java Tuples类型

//通过new Tuple2创建元组数据集
val TupleStream:DataStream[Tuple2[String,Int]] = env.fromElements(new Tuple2("唐太宗",1),new Tuple2("汉武帝",2))

三、Scala样例类

Flink通过实现CaseClassTypeInfo支持任意的Scala Case Class,包括Scala tuples类型,支持通过字段名称和位置索引获取指标,不支持存储空值

//scala样例类
case class bing(id:Int,name:String)
object TableTeat 
  def main(args: Array[String]): Unit = 
    //val senv = EnvironmentSettings.newInstance().inStreamingMode().build()
    val senv = StreamExecutionEnvironment.getExecutionEnvironment
    //val tenv = TableEnvironment.create(senv)
    val input = senv.fromElements(bing(1,"成吉思汗"),bing(2,"松赞干布"))
    input.print()
    senv.execute()
  

四、POJOs类型

POJOs类可以完成复杂数据结构的定义,Flink通过实现PojoTypeInfo来描述任意的POJOs,包括Java类和Scala类

  • POJOs类必须是Public修饰且必须独立定义,不能是内部类;
  • POJOs类中必须含有默认空构造器;
  • POJOs类中所有的Fields必须是Public或者具有Public修饰的getter和setter方法;
  • POJOs类中的字段类型必须是Flink支持的;
public class Person
	//字段具有public修饰符
	public String name;
	public int age;
	//具有默认空构造器
	public Person()
	
	public Person(String name,int age)
		this.name = name;
		this.age = age;
	

class Person(var name:String,var age:Int)
	def this()
		this(null,-1)
	

定义好后,就可以在Flink环境中使用

val personStream = env.fromElements(new Person("刘病己",14),new Person("刘秀",25))
personStream.keyBy("name")

五、特殊数据类型

val mapStream = env.fromElements(Map("name" -> "朱元璋","age" -> "18"),Map("name"-> "朱棣","age" -> "24"))

以上是关于Flink学习:Flink支持的数据类型的主要内容,如果未能解决你的问题,请参考以下文章

Flink学习

「Flink」Flink中的时间类型

flink支持的数据类型讲解(可序列化) 和 内置累加器的运用

Flink学习(十四) Flink 窗口时间和水位线

Flink 更新中

学习笔记Flink—— Flink数据流模型时间窗口和核心概念