iceberg 元数据组织方式

Posted PeersLee

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了iceberg 元数据组织方式相关的知识,希望对你有一定的参考价值。

metadata:

// org.apache.iceberg.hadoop.HadoopTableOperations#metadataRoot
private Path metadataRoot() 
    return new Path(location, "metadata");

metadata.json:

// org.apache.iceberg.hadoop.HadoopTableOperations#metadataFilePath
private Path metadataFilePath(int metadataVersion, TableMetadataParser.Codec codec) 
    return metadataPath("v" + metadataVersion + TableMetadataParser.getFileExtension(codec));
// org.apache.iceberg.TableMetadataParser#getFileExtension(org.apache.iceberg.TableMetadataParser.Codec)
public static String getFileExtension(Codec codec) 
    return codec.extension + ".metadata.json";

snapshot: 时间

// org.apache.iceberg.SnapshotProducer#manifestListPath
protected OutputFile manifestListPath() 
    return ops.io().newOutputFile(ops.metadataFileLocation(FileFormat.AVRO.addExtension(
                    String.format("snap-%d-%d-%s", snapshotId(), attempt.incrementAndGet(), commitUUID))));

manifest: 提交

// org.apache.iceberg.SnapshotProducer#newManifestOutput
protected OutputFile newManifestOutput() 
    return ops.io().newOutputFile(
            ops.metadataFileLocation(FileFormat.AVRO.addExtension(commitUUID + "-m" + manifestCount.getAndIncrement())));

data:

// org.apache.iceberg.LocationProviders.DefaultLocationProvider#DefaultLocationProvider
this.dataLocation = stripTrailingSlash(properties.getOrDefault(
            TableProperties.WRITE_NEW_DATA_LOCATION,
            String.format("%s/data", tableLocation)));

partition:

// org.apache.iceberg.LocationProviders.DefaultLocationProvider#newDataLocation(org.apache.iceberg.PartitionSpec, org.apache.iceberg.StructLike, java.lang.String)
public String newDataLocation(PartitionSpec spec, StructLike partitionData, String filename) 
    return String.format("%s/%s/%s", dataLocation, spec.partitionToPath(partitionData), filename);

 

以上是关于iceberg 元数据组织方式的主要内容,如果未能解决你的问题,请参考以下文章

iceberg 元数据组织方式

iceberg 元数据组织方式

数据湖08:Apache Iceberg原理和功能介绍

数据湖08:Apache Iceberg原理和功能介绍

数据湖:Iceberg表数据组织与查询

使用Hive SQL查询Iceberg表的正确姿势