Hdfs的列存储和行存储

Posted 呢喃的歌声

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hdfs的列存储和行存储相关的知识,希望对你有一定的参考价值。

列可以分开存储,对于重复性高的数据压缩比会高,但是在元组(行shi)恢复会比较消耗性能

 

于传统列存储不同 是行组会存储于同一节点中,列扫描会比较快(因为只需扫描一个行组)

以上是关于Hdfs的列存储和行存储的主要内容,如果未能解决你的问题,请参考以下文章

MySQL 表列数和行大小有哪些限制?

Hive数据模型

Hbase原理与架构

列式存储和行式存储的理解详解

parquet 简介(转)

Parquet学习总结