新兴的NoSQL数据库Cassandra,你知之几何?

Posted 云头条

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了新兴的NoSQL数据库Cassandra,你知之几何?相关的知识,希望对你有一定的参考价值。

《使命召唤》游戏、Hive智能恒温器、Social Weather应用程序和威廉希尔(William Hill)博彩应用程序,这些有何共同之处?它们的背后都离不开Apache Cassandra NoSQL数据库。

美国天气频道、英国天然气集团、游戏公司Activision和威廉希尔博彩公司(William Hill)分属不同的行业,有不同的客户和不同的经营计划。但是这些公司有一个共同点:它们都依赖Apache Cassandra NoSQL数据平台,处理不断增长的数据量,并提供个性化客户体验。


随着物联网及新技术的兴起,许多公司能够收集和使用数量空前之多的数据。更多数据也意味着更高的期望和更激烈的竞争,以便在市场立于不败之地。


游戏也疯狂


Activision公司的消费者技术高级主管Darryl Kanhouse告诉Computer Weekly:“如今的关键是,实时数据触手可及。”这家公司开发了数款知名游戏,比如《使命召唤》、《吉他英雄》和《命运》。


他说:“数据必须正确,还是随时可用――这是永无止境的挑战。我们需要数据驱动的决策,提供针对性的个性化体验,这方面的要求在提高。目光所及之处,大家都着眼于个性化体验。”


该公司在2011年开始启动了一个项目,改善使用数据提供一种更好的客户体验的方式。它尝试过好多不同的数据库,包括Oracle、MongoDB和Infobright,经常换来换去,试图找到一种能解决所有难题的数据库。


2014年,它尝试了Apache Cassandra――Kanhouse说,此后再没有换成别的数据库,这可是五年来头一次。


Cassandra是一种可灵活扩展的NoSQL开源数据库,为需要高速性能、没有停运时间的应用系统充当了平台。


《使命召唤:高级战争》在2014年发布后,Activision尝试了一种新的系统:根据实时数据,公司能够以高度个性化的通信方式发信息给游戏玩家,改善玩家的体验,并加强参与性。而这牵涉大量数据,据Kanhouse声称,“要不是Cassandra,公司做不到这点。”


摈弃主从关系


虽然Cassandra是开源平台,不过它也有企业版(客户可通过Datastax Enterprise来获得)。该产品建立在Cassandra的基础上,提供了诸多额外功能,比如搜索、分析和高性能。


该数据库旨在处理分布在诸多大众化服务器之间的大量数据。不像大多数数据库,Cassandra没有主从关系;相反,数据分布在对等节点之间,这意味着根本不存在单一故障点。


Cassandra以希腊神话中那位美丽而神秘的先知卡姗德拉(Cassandra)命名,她对未来所作的预测从来没有人相信。而在数据库领域,Cassandra似乎有许多拥趸。


它一直被誉为是“未来的数据库”;从最近在加州圣克拉克召开的2015年Cassandra峰会上的动静来看,它可能确实有料。有6000多名Cassandra用户出席了峰会(亲自到场或网上出席),而2014年只有2000人,这款数据库似乎变得越来越流行。


押宝开源


Cassandra还开始扩大其在英国的客户群。其中一个客户是在线博彩公司威廉希尔,它最近开发的一个数据平台就基于开源技术(包括Cassandra)。


威廉希尔公司的研发负责人Patrick Di Loreto说:“在虚拟环境中,一定要有表现稳定的网络。”


他补充说:“任何一种停运都意味着,我们不仅损失钱财,还会丢失客户。”他解释道,如果系统偏偏在客户下注的节骨眼上崩溃,后果会很惨重。


拥有一种可灵活扩展的数据库还意味着,威廉希尔可以做更多的工作,提供个性化的用户体验。


Di Loreto说:“如果我们知道某个客户是利物浦球迷,当下又有比赛,我们知道他很可能会看赛。所以,我们就能把相关数据推送到他的移动应用程序,改善其体验。”


互联家庭


威廉希尔不是唯一在使用Cassandra方面一路领跑的英国公司。英国天然气互联家庭(British Gas Connected Homes)是这家能源公司旗下的技术开发部门,现使用Cassandra整合众多项目的不同后端系统。


互联家庭在使用Hive应用程序,这种智能恒温器让用户可以通过智能手机来控制家里暖气。Hive目前有23万个客户,包括每个客户的50万个数据点,所以需要跟踪大量数据。


2015年1月,开发团队启动了互联燃气锅炉项目。该项目目前处于试用阶段,旨在能够预测锅炉何时失效。团队还在试推行一个名为my energy live的项目,这个应用程序连接至智能仪表,让客户可以跟踪能源使用情况,并与邻居家的作一比较。


互联家庭的数据工程主管Josep Calas说:“这意味着,我们可以实时告诉相关数据。无论你是平常的能源使用模式,使用过多,还是出现漏气、而你蒙在鼓里,我们就能提醒你。”


该项目正在少量客户当中试行,但公司已经在展望未来,由于能够使用实时数据,认为大有潜力。


与Activision一样,这家公司尝试过许多不同的数据库平台,在不同的平台上尝试不同的项目,最后把它们统统放在Cassandra上。


Calas说:“我们现在有一个统一后端。想法是,我们能让来自不同数据源的运行数据获得显著的协同效应。比如说,如果你在Cassandra中有电力使用数据和实时温度数据,就能做成一个家庭热模型,确定窗户是否开着。”


该公司使用Cassandra,没必要担心可扩展性或添加更多的数据会导致系统崩溃。不过,互联家庭遇到的一个困难是,找到使用Cassandra方面有经验的人员。Calas说:“该数据库看起来很简单,实则不然。”


预测天气


美国天气频道(Weather Channel)在2013年开始运行Cassandra,当初仅仅是为了跟踪应用程序的统计数据,此后迅速加大了使用Cassandra的力度。在自封为Cassandra宣传官的软件开发经理Robbie Strickland的带领下,公司显著扩大了Cassandra的应用范围,还使用该数据库发布了新的应用程序:Social Weather。


Cassandra提供全面培训,很乐意将专家外派到企业组织,但是天气频道决定自己搞(得益于拥有像Strickland这样的宣传官)。他说:“其中一方面是教育过程。我培训团队中的成员,教他们如何使用Cassandra。现在,我的团队成了专家。”


然而,Cassandra并非总是没有困难。Strickland说:“我把Cassandra比作航天飞机,这是很复杂的系统。它可以将你带到其他技术无法企及的许多地方,但是也有好多旋钮,一旦弄错,就会性命攸关。”


这家公司大力倡导开源,已决定不利用Datastax Enterprise这个版本。Strickland承认:“我们非常支持开源,没有使用Datastax,有时我们为此大伤脑筋。”他甚至出了一本Cassandra方面的书。他表示,但是设法全面了解、熟练运用这款数据库(尽管看似很复杂)应该不是太大的问题。


Cassandra峰会在五年内得到了长足发展,与会者数量从头一年的区区两位数,到2015年已超过6000人。从峰会人气、NoSQL数据库日益流行的趋势以及Cassandra的众多知名客户(比如Netflix、惠普、BIM、推特、苹果和思科)来看,将来很可能会出现更多的Cassandra宣传官。


新闻来源:ComputerWeekly|云头条翻译(未经授权谢绝转载)


以上是关于新兴的NoSQL数据库Cassandra,你知之几何?的主要内容,如果未能解决你的问题,请参考以下文章

NoSQL概述-从Mongo和Cassandra谈谈NoSQL

Cassandra CQL - NoSQL 或 SQL

开源Nosql数据库Cassandra3.0实战-集群部署与插件使用

数据源管理 | 分布式NoSQL系统,Cassandra集群管理

开源软件:NoSql数据库 - 图数据库 Cassandra

支持的 Cassandra NoSQL 数据库类型