数据仓库系列 之Clickhouse中的更新和删除操作

Posted 琅晓琳

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库系列 之Clickhouse中的更新和删除操作相关的知识,希望对你有一定的参考价值。

测试数据

select count(*) from system.columns where table='test_update';
select count(*) from test_update;

具体删除&更新实现

语法 如下:
ALTER TABLE <table_name> DELETE WHERE <filter>;
ALTER TABLE <table_name> UPDATE col1 = expr1, ... WHERE <filter>;

ALTER TABLE test_update UPDATE event_status_key=0 where event_status_key=22;

该命令是异步执行的,可以通过查看表 system.mutations 来查看命令的是否执行完毕。

Clickhouse更新操作有一些限制:
索引列不能进行更新;
分布式表不能进行更新;
ALTER TABLE UPDATE/DELETE不支持分布式DDL,因此需要在分布式环境中手动在每个节点上local的进行更新/删除数据;
不适合频繁更新或point更新由于Clickhouse更新操作非常耗资源,如果频繁的进行更新操作,可能会弄崩集群,请谨慎操作。

参考资料:
http://t.zoukankan.com/wenBlog-p-15745238.html 在clickhouse中更新和删除

以上是关于数据仓库系列 之Clickhouse中的更新和删除操作的主要内容,如果未能解决你的问题,请参考以下文章

大数据ClickHouse:MergeTree系列表引擎之CollapsingMergeTree

ClickHouse SQL 极简教程ClickHouse SQL之数据操作语言 DML

大数据ClickHouse(十六):ClickHouse SQL语法之DML 操作

ClickHouse数据仓库使用之limit实践

大数据ClickHouse:MergeTree系列表引擎之MergeTree(重点掌握)

ClickHouse学习系列之三配置文件说明