Cassandra 分页在并发插入时的行为方式
Posted
技术标签:
【中文标题】Cassandra 分页在并发插入时的行为方式【英文标题】:How Cassandra pagination behaves on concurrent inserts 【发布时间】:2016-01-02 11:09:09 【问题描述】:我使用 Java 客户端和 PagingState 使用 Cassanda 2.2 对大型结果集进行分页,如下所述:https://datastax.github.io/java-driver/2.2.0-rc2/features/paging/
这很好用,但我找不到任何关于 Cassandra 行为的信息,当对结果进行分页时,插入新记录(或更新现有记录)。结果中是否包含这些新的或更改的记录,或者结果集是不可变的?
用例是一个无状态的 Web 服务,客户端可以在其中查询大型结果集。
编辑: ResultSet 分页的一般问题(Cassandra 在这里自动延迟获取)
EDIT2:据我所知,Cassandra 不支持 ACID,但支持 AID 事务,所以我希望在通过结果集时在这里有一种隔离
【问题讨论】:
【参考方案1】:没有这样的隔离,因为实施起来成本太高。整个结果集不会保存在内存中,当当前的结果集发送到客户端时,下一页中要返回的行是未知的。
这样做的一个有趣结果是它违反了 BATCH 更新保证,在文档中声明如下:
@BATCH@ 中属于给定分区键的所有更新都是单独执行的。
有一个关于这个的issue 开放。
还有一些性能影响,因为为获取页面n
所做的大量工作必须再次完成以获取页面n + 1
(例如打开和读取索引文件和数据文件)。 Scylla 是我贡献的 Cassandra 的临时替代品,正在开发 fixing this。
【讨论】:
@salyh 那么您尝试了哪些分页方法?如果在两个连续的页面请求之间发生插入,则页面返回不正确的数据,是否有解决方法,还是应该是乐观分页?以上是关于Cassandra 分页在并发插入时的行为方式的主要内容,如果未能解决你的问题,请参考以下文章