具有非规范化的 cassandra 数据建模

Posted 2023-03-08

技术标签:

【中文标题】具有非规范化的 cassandra 数据建模【英文标题】：cassandra data modeling with denormalization 【发布时间】：2021-02-11 17:41:54 【问题描述】：

我读了cassandra data modeling，除了非规范化数据可能会改变之外，一切都很清楚。我如何同步它？当用户的电子邮件从此示例更改时，更新email 的方法是什么：

CREATE TABLE groups ( groupname text, username text, email text, age int, hash_prefix int, PRIMARY KEY ((groupname, hash_prefix), username) )

groupname属于群组，数据模型中的用户可能不知道任何群组，因此用户更改后无法更新电子邮件。

下面描述的解决方案是否合适？

向用户模型添加一列groups（输入set<text>）

如果用户模型有一个主键username，那么我可以向应用程序添加一些DAOperUser(username) 和updateName 和addGroup 方法。

对于每个username 实例化自己的对象（通过工厂），它将在初始化时从user 表中读取状态。这样，它将具有username 和groups，因此可以将两个表（users 和groups）的更改视为write batch。

【问题讨论】：

【参考方案1】：

在插入或更新数据时，需要使用BATCH语句保持users和groups两个表之间的数据同步。

例如：

BEGIN BATCH
  INSERT INTO users (...) VALUES (...);
  INSERT INTO groups (...) VALUES (...);
APPLY BATCH;

如果您有兴趣，https://www.datastax.com/dev 上有一个免费教程，其中详细解释了这些概念，并在预安装在同一浏览器选项卡上运行的 Cassandra 集群上进行了实践练习 - Atomicity and Batches。干杯！

【讨论】：

我理解 BATCH 语句的概念。问题是“当username 更新时没有groupname”。由于 Cassandra 的分布式特性，Read-befor-write 是一种反模式。

以上是关于具有非规范化的 cassandra 数据建模的主要内容，如果未能解决你的问题，请参考以下文章