Flink Hive Source 并行度推断源码解析

Posted 2022-12-03 zhisheng_blog

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Flink Hive Source 并行度推断源码解析相关的知识，希望对你有一定的参考价值。

批读 Hive

HiveOptions 中有两个配置

public static final ConfigOption<Boolean> TABLE_EXEC_HIVE_INFER_SOURCE_PARALLELISM =
        key("table.exec.hive.infer-source-parallelism")
                .defaultValue(true)
                .withDescription(
                        "If is false, parallelism of source are set by config.\\n" +
                        "If is true, source parallelism is inferred according to splits number.\\n");

public static final ConfigOption<Integer> TABLE_EXEC_HIVE_INFER_SOURCE_PARALLELISM_MAX =
        key("table.exec.hive.infer-source-parallelism.max")
                .defaultValue(1000)
                .withDescription("Sets max infer parallelism for source operator.");

table.exec.hive.infer-source-parallelism：默认值是 true，表示 source 的并行度是根据数据分区数和文件数推断的，如果设置为 false 的话表示并行度是以配置的为准

以上是关于Flink Hive Source 并行度推断源码解析的主要内容，如果未能解决你的问题，请参考以下文章