关于Cassandra的错误观点

Posted InfoQ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于Cassandra的错误观点相关的知识,希望对你有一定的参考价值。

正如Apache Cassandra的名称是来自于著名的物洛伊女巫一样,在它身上确实存在着各种误解。和大多数误解一样,至少在一开始时它们确实是有那么一点道理的,但随着Cassandra不断地深化与改善,这些误解的内容已经不复存在了。本文将针对五个常见的疑惑作出解释,澄清人们的困惑。


误解:Cassandra就是一个嵌套的map

理解Cassandra的数据模型的最好方式是将其想像为表与行的组合,并且与关系型数据相似的是,Cassandra的列也是强类型的,并且可以进行索引。而我们之所以在开始的部分选择避开“表与行”这种方法,原因之一是因为Cassandra的表与你所熟的关系型数据库的表的确存在着某些微妙的差别。


误解:Cassandra的读取速度较慢

Cassandra采用的日志结构存储引擎意味着它不会在硬盘中寻找更新,也不会造成固态硬盘的写入放大,而同时它的读取速度也很快。


误解:Cassandra的运行很麻烦

Cassandra是一个完整的分布式系统:因为Cassandra集群中的每一台机器都具有相同的角色,不存在专门的元数据服务器以调整内存中的各种信息,也不存在专门的配置服务器以进行分发,同样也不存在主服务器或者是故障转移服务器。这种特性使运行Cassandra从各方面而言都要比其它的一些替代产品来得更简单。Cassandra的日常维护工作很简单。Cassandra在对多数据中心的支持方面在整个业界都处于领先地位,即使是整个AWS区域挂掉,甚至是整个数据中心在飓风中被摧毁这些极端情况下,也可以顺利地进行恢复。最后,DataStax OpsCenter能够让你随时看到集群的各种重要系统指标,这样就可以方便地将历史活动数据与造成服务性能下降的事故相关联起来,以达到简化故障检测的目的。


误解:在Cassandra上进行开发非常困难

Cassandra推出了一套自己的SQL语言:CQL。它提供了一套更易于使用的接口,学习曲线更为平滑,同时还推出了一套异步协议,因此取代了Thrift API的使用。今年1月份发布的1.2版本终于使CQL成为一个可用于生产环境的产品了。新版本包含了多种驱动程序,性能也比Thrift更好。DataStax也为最流行的各种CQL驱动程序提供了官方支持。


误解:Cassandra依然是一种无人问津的边缘产品

各个商业机构都看到了Cassandra为他们的组织所带来的价值,财富榜上的百强内有20个机构都依赖于Cassandra为他们的关键应用程序提供服务。将应用迁移至Cassandra平台上的最常见原因之一,是现有技术的伸缩性已经不足以满足现代化大数据应用程序的需求了。全球最大的云应用Netflix已经将其95%的数据从Oracle迁移至Cassandra,而Barracuda Networks也用Cassandra取代了mysql,因为MySQL已经不能够应对巨量的垃圾请求了。而Ooyala每天都要进行20亿次数据处理,它所使用的Cassandra已有超过两个PB的数据量了。


更多精彩内容,请点击阅读原文。


***********************************

本文来自InfoQ微信公众账号:infoqchina

1、回复“今日新闻”,查看今天更新的新闻;

2、回复“今日英文”,查看今天英文站的更新;

3、回复“文章 +关键词”,搜索关键词相关内容;

4、回复“QCon”,了解QCon大会相关信息;

5、回复“活动”,了解最近InfoQ组织的线下沙龙;

7、回复“投稿”,了解投稿和加入编辑团队的流程。

***********************************

以上是关于关于Cassandra的错误观点的主要内容,如果未能解决你的问题,请参考以下文章

cassandra 调试问题

JBOD 关于 cassandra 问题

在mysql vs cassandra中插入速度

在 Cassandra 2.1.7 中检测到错误泄漏

Pyspark 和 Cassandra 连接错误

Cassandra 错误:检测到泄漏