为什么在将Cassandra迁移到Cosmos之后数据大小会增加?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了为什么在将Cassandra迁移到Cosmos之后数据大小会增加?相关的知识,希望对你有一定的参考价值。
我们成功地将大约3 GB的数据从Cassandra迁移到了Cosmos。观察到数据大小增加约5倍(相同数据;尚未添加额外行)
虽然我从别人那里听到这是预期的,
- 为什么同一数据的数据大小会增加? Cassandra对同样的数据保持低调,但Cosmos膨胀它。
- 是否有任何工具可以验证是否已成功迁移所有数据?
Azure Cosmos DB可以根据您的需求增长自动扩展存储和吞吐量。您可以使用Azure Cosmos DB request unit calculator估算吞吐量需求如果您使用此规划器,这应该可以让您了解将要使用的数据存储的比率。
另一个因素是使用:Horizontal Partitioning/Scaling,这可能是导致数据量增加的主要因素。我建议重新分区(文档包括如何使用的链接。)。要监控这是否是原因,您可以使用monitoring of your partitions:
要确定按分区细分的任何分区容器的存储分布,请转至Azure门户中的“度量标准”刀片。在“存储”选项卡中,存储细分显示在顶部分区键图表所占用的数据+索引存储中。
如有任何其他问题,请随时联系Cosmos DB团队:askcosmosdb [at] microsoft.com
以上是关于为什么在将Cassandra迁移到Cosmos之后数据大小会增加?的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 Cassandra API 将 Python 的 cosmos_client 连接到 Cosmos DB 实例?
微软通过Cosmos DB向MongoDB和Cassandra发起挑战
Oracle 到 Apache Cassandra 数据迁移