Cassandra 分页在并发插入时的行为方式

Posted

技术标签:

【中文标题】Cassandra 分页在并发插入时的行为方式【英文标题】:How Cassandra pagination behaves on concurrent inserts 【发布时间】:2016-01-02 11:09:09 【问题描述】:

我使用 Java 客户端和 PagingState 使用 Cassanda 2.2 对大型结果集进行分页,如下所述:https://datastax.github.io/java-driver/2.2.0-rc2/features/paging/

这很好用,但我找不到任何关于 Cassandra 行为的信息,当对结果进行分页时,插入新记录(或更新现有记录)。结果中是否包含这些新的或更改的记录,或者结果集是不可变的?

用例是一个无状态的 Web 服务,客户端可以在其中查询大型结果集。

编辑: ResultSet 分页的一般问题(Cassandra 在这里自动延迟获取)

EDIT2:据我所知,Cassandra 不支持 ACID,但支持 AID 事务,所以我希望在通过结果集时在这里有一种隔离

【问题讨论】:

【参考方案1】:

没有这样的隔离,因为实施起来成本太高。整个结果集不会保存在内存中,当当前的结果集发送到客户端时,下一页中要返回的行是未知的。

这样做的一个有趣结果是它违反了 BATCH 更新保证,在文档中声明如下:

@BATCH@ 中属于给定分区键的所有更新都是单独执行的。

有一个关于这个的issue 开放。

还有一些性能影响,因为为获取页面n 所做的大量工作必须再次完成以获取页面n + 1(例如打开和读取索引文件和数据文件)。 Scylla 是我贡献的 Cassandra 的临时替代品,正在开发 fixing this。

【讨论】:

@salyh 那么您尝试了哪些分页方法?如果在两个连续的页面请求之间发生插入,则页面返回不正确的数据,是否有解决方法,还是应该是乐观分页?

以上是关于Cassandra 分页在并发插入时的行为方式的主要内容,如果未能解决你的问题,请参考以下文章

请求分页管理方式

请求分页管理方式

cassandra中列表集合的模型分页

Fit项目分页组件的编写

Cassandra 不执行带有时间戳字段的插入语句

UICollectionView 分页在 2^24 像素后中断