ClickHouse创建分布式表

Posted 2022-03-26 年少~年

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了ClickHouse创建分布式表相关的知识，希望对你有一定的参考价值。

clickhouse集群主要有两个作用,一是数据副本,也就是将数据冗余到另外的机器上，用于保证高可用；二是分布表，就是将一个表的数据分散到多个节点上保存，然后再通过Distributed表引擎将数据拼接起来作为一个完整的表使用。
创建分布式表：

1.查看clickhouse 默认的集群配置

SELECT  * from `system`.clusters 
随便拿一个cluster 的值测试

2. 创建本地表

 CREATE TABLE default.test_list_local  on cluster test_cluster_two_shards
    (
    `uuid` UUID,
    `creat_datetime` DateTime COMMENT '创建时间'
    )
    ENGINE = MergeTree()
    PARTITION BY toYYYYMM(creat_datetime)
    ORDER BY (creat_datetime);

3. 使用Distributed表引擎创建分布式表

CREATE TABLE default.test_list  on cluster test_cluster_two_shards
(
    `uuid` UUID,
    `creat_datetime` DateTime COMMENT '创建时间'
)
    engine = Distributed(test_cluster_two_shards,default,test_list_local, rand());

Distributed(test_cluster_two_shards,default,test_list_local, rand()) 中部分解释
test_cluster_two_shards 表示服务器集群配置
default  远程数据库名
test_list_local 远程数据表名，对应的本地表名
rand() 分片key

4. 查询与写入都是使用 test_list 表

clickhouse 分布式引擎文档 https://clickhouse.com/docs/zh/engines/table-engines/special/distributed/

以上是关于ClickHouse创建分布式表的主要内容，如果未能解决你的问题，请参考以下文章

ClickHouse创建分布式表

1.查看clickhouse 默认的集群配置

2. 创建本地表

3. 使用Distributed表引擎创建分布式表

4. 查询 与 写入 都是使用 test_list 表

4. 查询与写入都是使用 test_list 表