Cassandra数据库上数据分析的替代方案

Posted 2021-05-04

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Cassandra数据库上数据分析的替代方案相关的知识，希望对你有一定的参考价值。

我们需要对Cassandra数据库执行分析和报告。

以下是我们迄今已确定的方法。

1）在cassandra顶部使用火花。

缺点：

2）将数据移至红移并在其上执行分析。

缺点：

我们需要将数据从cassandra移动到redshift。我们已经确定AWS Firehose为我们这样做了。随着写入cassandra，我们也会写入firehose流，它将为我们写入redshift。
涉及redshift和Firehose的AWS成本。

到目前为止，我们倾向于红移。我的假设是否有任何错误。？有没有替代品？

答案

使用Cassandra的Spark可能是更常见的选择。值得注意的两点是：a）你可以使用Spark在内存中缓存RDD，2）Spark SQL工作正常，你不需要使用Spark的编程语言。

以上是关于Cassandra数据库上数据分析的替代方案的主要内容，如果未能解决你的问题，请参考以下文章