为什么在将Cassandra迁移到Cosmos之后数据大小会增加?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了为什么在将Cassandra迁移到Cosmos之后数据大小会增加?相关的知识,希望对你有一定的参考价值。

我们成功地将大约3 GB的数据从Cassandra迁移到了Cosmos。观察到数据大小增加约5倍(相同数据;尚未添加额外行)

虽然我从别人那里听到这是预期的,

  1. 为什么同一数据的数据大小会增加? Cassandra对同样的数据保持低调,但Cosmos膨胀它。
  2. 是否有任何工具可以验证是否已成功迁移所有数据?
答案

Azure Cosmos DB可以根据您的需求增长自动扩展存储和吞吐量。您可以使用Azure Cosmos DB request unit calculator估算吞吐量需求如果您使用此规划器,这应该可以让您了解将要使用的数据存储的比率。

另一个因素是使用:Horizontal Partitioning/Scaling,这可能是导致数据量增加的主要因素。我建议重新分区(文档包括如何使用的链接。)。要监控这是否是原因,您可以使用monitoring of your partitions

要确定按分区细分的任何分区容器的存储分布,请转至Azure门户中的“度量标准”刀片。在“存储”选项卡中,存储细分显示在顶部分区键图表所占用的数据+索引存储中。

如有任何其他问题,请随时联系Cosmos DB团队:askcosmosdb [at] microsoft.com

以上是关于为什么在将Cassandra迁移到Cosmos之后数据大小会增加?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Cassandra API 将 Python 的 cosmos_client 连接到 Cosmos DB 实例?

微软通过Cosmos DB向MongoDB和Cassandra发起挑战

Oracle 到 Apache Cassandra 数据迁移

数据从SQL Server迁移到Azure Cosmos数据库后无法查看数据

如何从Cassandra DB获取/导出所有数据

Windows上Cassandra的当前状态和迁移路径是什么?