具有非规范化的 cassandra 数据建模
Posted
技术标签:
【中文标题】具有非规范化的 cassandra 数据建模【英文标题】:cassandra data modeling with denormalization 【发布时间】:2021-02-11 17:41:54 【问题描述】:我读了cassandra data modeling,除了非规范化数据可能会改变之外,一切都很清楚。我如何同步它?
当用户的电子邮件从此示例更改时,更新email
的方法是什么:
CREATE TABLE groups ( groupname text, username text, email text, age int, hash_prefix int, PRIMARY KEY ((groupname, hash_prefix), username) )
groupname
属于群组,数据模型中的用户可能不知道任何群组,因此用户更改后无法更新电子邮件。
下面描述的解决方案是否合适?
向用户模型添加一列groups
(输入set<text>
)
如果用户模型有一个主键username
,那么我可以向应用程序添加一些DAOperUser(username)
和updateName
和addGroup
方法。
对于每个username
实例化自己的对象(通过工厂),它将在初始化时从user
表中读取状态。这样,它将具有username
和groups
,因此可以将两个表(users
和groups
)的更改视为write batch
。
【问题讨论】:
【参考方案1】:在插入或更新数据时,需要使用BATCH语句保持users
和groups
两个表之间的数据同步。
例如:
BEGIN BATCH
INSERT INTO users (...) VALUES (...);
INSERT INTO groups (...) VALUES (...);
APPLY BATCH;
如果您有兴趣,https://www.datastax.com/dev 上有一个免费教程,其中详细解释了这些概念,并在预安装在同一浏览器选项卡上运行的 Cassandra 集群上进行了实践练习 - Atomicity and Batches。干杯!
【讨论】:
我理解 BATCH 语句的概念。问题是“当username
更新时没有groupname
”。由于 Cassandra 的分布式特性,Read-befor-write
是一种反模式。以上是关于具有非规范化的 cassandra 数据建模的主要内容,如果未能解决你的问题,请参考以下文章