列式数据库

Posted 法海你懂不

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了列式数据库相关的知识,希望对你有一定的参考价值。

行式数据库是按照行存储的,行式数据库擅长随机读操作不适合用于大数据。像SQL server, Oracle, mysql等传统的是属于行式数据库范畴。列式存储数据库以列为单位聚合数据,然后将列值顺序地存入磁盘。列式数据库从一开始就是面向大数据环境下数据仓库的数据分析而产生。

简单来说:

行式数据库把一行中的数据值串在一起存储起来,然后再存储下一行的数据,以此类推。
列式数据库把一列中的数据值串在一起存储起来,然后再存储下一列的数据,以此类推。

列式存储的出现主要基于这样一种假设对于特定的查询,不是所有的值都是必需的。尤其在分析型数据里面,这种情形非常常见,因此需要选择一种更为合适的存储模式。

在这种新的设计中,减少I/O只是众多主要因素之一,还有其他的优点:因为列的数据类型是天生相似的,即便逻辑上每一行之间存在轻微的不同,但仍旧比按行存储的结构聚集在一起的数据更利于压缩,因为大多数算法只关注有限的压缩窗口。

以上是关于列式数据库的主要内容,如果未能解决你的问题,请参考以下文章

多元统计SPSS

认识一下 ClickHouse

认识一下 ClickHouse

生词生词生词生词[3]

生词生词生词生词[3]

什么是列式存储数据库?