ClickHouse 单机安装及基础知识与 Spark 应用
Posted 月亮给我抄代码
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ClickHouse 单机安装及基础知识与 Spark 应用相关的知识,希望对你有一定的参考价值。
什么是 ClickHouse?
ClickHouse 是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。
在传统的行式数据库系统中,数据按如下顺序存储:
处于同一行中的数据总是被物理的存储在一起。
常见的行式数据库系统有:mysql、Postgres等。
在列式数据库系统中,数据按如下的顺序存储:
这些示例只显示了数据的排列顺序。来自不同列的值被单独存储,来自同一列的数据被存储在一起。
不同的数据存储方式适用不同的业务场景,数据访问的场景包括:进行了何种查询、多久查询一次以及各类查询的比例;每种类型的查询(行、列和字节)读取多少数据;读取数据和更新之间的关系;使用的数据集大小以及如何使用本地的数据集;是否使用事务,以及它们是如何进行隔离的;数据的复制机制与数据的完整性要求;每种类型的查询要求的延迟与吞吐量等等。
(摘抄自 ClickHouse 官网)
ClickHouse 特性
在一个真正的列式数据库管理系统中,除了数据本身外不应该存在其他额外的数据。这意味着为了避免在值旁边存储它们的长度«
以上是关于ClickHouse 单机安装及基础知识与 Spark 应用的主要内容,如果未能解决你的问题,请参考以下文章