20 数据存储服务器集群的伸缩性设计

Posted water___Wang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了20 数据存储服务器集群的伸缩性设计相关的知识,希望对你有一定的参考价值。

和缓存服务器集群的伸缩性设计不同,数据存储服务器集群的伸缩性对数据的持久 性和可用性提出了更高的要求。

缓存的目的是加速数据读取的速度并减轻数据存储服务器的负载压力,因此部分缓 存数据的丢失不影响业务的正常处理,因为数据还可以从数据库等存储服务器上获取。

而数据存储服务器必须保证数据的可靠存储,任何情况下都必须保证数据的可用性 和正确性。因此缓存服务器集群的伸缩性架构方案不能直接适用于数据库等存储服务器。 存储服务器集群的伸缩性设计相对更复杂一些,具体说来,又可分为关系数据库集群的 伸缩性设计和NoSQL数据库的伸缩性设计。


1 关系数据库集群的伸缩性设计

关系数据库凭借其简单强大的SQL和众多成熟的商业数据库产品,占据了从企业应 用到网站系统的大部分业务数据存储服务。市场上主要的关系数据都支持数据复制功能, 使用这个功能可以对数据库进行简单伸缩。图6.14为使用数据复制的mysql集群伸缩性方案。

在这种架构中,虽然多台服务器部署MySQL实例,但是它们的角色有主从之分,数据写操作都在主服务器上,由主服务器将数据同步到集群中其他从服务器,数据读操作 及数据分析等离线操作在从服务器上进行。

除了数据库主从读写分离,前面提到的业务分割模式也可以用在数据库,不同业务数据表部署在不同的数据库集群上,即俗称的数据分库。这种方式的制约条件是跨库的 表不能进行Join操作。

在大型网站的实际应用中,即使进行了分库和主从复制,对一些单表数据仍然很大的表,比如Facebook的用户数据库,淘宝的商品数据库,还需要进行分片,将一张表拆 开分别存储在多个数据库中。

目前网站在线业务应用中比较成熟的支持数据分片的分布式关系数据库产品主要有 开源的 Amoeba ( http://sourcefbrge.net/projects/amoeba/ )和 Cobar ( http://code.alibabatech. com/wiki/display/cobar/Home)。这两个产品有相似的架构设计,以Cobar为例,部署模型 如图6.15所示。

Cobar是一个分布式关系数据库访问代理,介于应用服务器和数据库服务器之间 (Cobar也支持非独立部署,以lib的方式和应用程序部署在一起)。应用程序通过JDBC 驱动访问Cobar集群,Cobar服务器根据SQL和分库规则分解SQL,分发到MySQL集群 不同的数据库实例上执行(每个MySQL实例都部署为主/从结构,保证数据高可用)。

前端通信模块负责和应用程序通信,接收到SQL请求(select * from users where userid in (12,22,23))后转交给SQL解析模块,SQL解析模块解析获得SQL中的路由规则查询 条供userid in( 12,22,23)博转交给SQL路由模块,SQL路由模块根据路由规则配置(userid 为偶数路由至数据库A, userid为奇数路由至数据库B )将应用程序提交的SQL分解成两 条 SQL( select * from users where userid in (12,22); select * from users where userid in (23);) 转交给SQL执行代理模块,发送至数据库A和数据库B分别执行。

数据库A和数据库B的执行结果返回至SQL执行模块,通过结果合并模块将两个返 回结果集合并成一个结果集,最终返回给应用程序,完成在分布式数据库中的一次访问 请求。

那么Cobar如何做集群的伸缩呢?

Cobar的伸缩有两种:Cobar服务器集群的伸缩和MySQL服务器集群的伸缩。

Cobar服务器可以看作是无状态的应用服务器,因此其集群伸缩可以简单使用负载均 衡的手段实现。而MySQL中存储着数据,要想保证集群扩容后数据一致负载均衡,必须 要做数据迁移,将集群中原来机器中的数据迁移到新添加的机器中,如图6.17所示。

具体迁移哪些数据可以利用一致性Hash算法(即路由模块使用一致性Hash算法进
行路由),尽量使需要迁移的数据最少。但是迁移数据需要遍历数据库中每条记录(的索 引),重新进行路由计算确定其是否需要迁移,这会对数据库访问造成一定压力。并且需 要解决迁移过程中数据的一致性、可访问性、迁移过程中服务器宕机时的可用性等诸多
问题。

实践中,Cobar利用了 MySQL的数据同步功能进行数据迁移。数据迁移不是以数据 为单位,而是以Schema为单位。在Cobar集群初始化时,在每个MySQL实例创建多个 Schema (根据业务远景规划未来集群规模,如集群最大规模为1000台数据库服务器,那 么总的初始Schema数N 1000 )o集群扩容的时候,从每个服务器中迁移部分Schema到新机器中,由于迁移以Schema为单位,迁移过程可以使用MySQL的同步机制,如图6.18所示。

同步完成时,即新机器中Schema数据和原机器中Schema数据一致的时候,修改Cobar 服务器的路由配置,将这些Schema的IP修改为新机器的IP,然后删除原机器中的相关 Schema,完成MySQL集群扩容。

在整个分布式关系数据库的访问请求过程中,Cobar服务器处理消耗的时间是很少 的,时间花费主要还是在MySQL数据库端,因此应用程序通过Cobar访问分布式关系数 据库,性能基本和直接访问关系数据库相当,可以满足网站在线业务的实时处理需求。 事实上由于Cobar代替应用程序连接数据库,数据库只需要维护更少的连接,减少不必要 的资源消耗,改善性能。

但由于Cobar路由后只能在单一数据库实例上处理查询请求,因此无法执行跨库的 JOIN操作,当然更不能执行跨库的事务处理。

相比关系数据库本身功能上的优雅强大,目前各类分布式关系数据库解决方案都显得非常简陋,限制了关系数据库某些功能的使用。但是当网站业务面临不停增长的海量 业务数据存储压力时,又不得不利用分布式关系数据库的集群伸缩能力,这时就必须从 业务上回避分布式关系数据库的各种缺点:避免事务或利用事务补偿机制代替数据库事 务;分解数据访问逻辑避免JOIN操作等。

除了上面提到的分布式数据库,还有一类分布式数据库可以支持JOIN操作执行复杂 的SQL查询,如GreenPlum。但是这类数据库的访问延退比较大(可以想象,JOIN操作 需要在服务器间传输大量的数据),因此一般使用在数据仓库等非实时业务中。


2 NoSQL数据库的伸缩性设计

在计算机数据存储领域,一直是关系数据库(Relation Database )的天下,以至传统企业应用领域,许多应用系统设计都是面向数据库设计一先设计数据库然后设计程序, 从而导致关系模型绑架对象模型,并由此引申出旷日持久的业务对象贫血模型与充血模 型之争。业界为了解决关系数据库的不足,提出了诸多方案,比较有名的是对象数据库, 但是这些数据库的出现只是进一步证明关系数据库的优越而已。直到大型网站遇到了关系数据库难以克服的缺陷一一糟糕的海量数据处理能力及僵硬的设计约束,局面才有所 改善。为了解决上述问题,NoSQL这一概念被提了出来,以弥补关系数据库的不足。

NoSQL,主要指非关系的、分布式的数据库设计模式。也有许多专家将NoSQL解读为Not Only SQL,表示NoSQL只是关系数据库的补充,而不是替代方案。一般而言,NoSQL数据库产品都放弃了关系数据库的两大重要基础:以关系代数为基础的结构化查询语言(SQL )和事务一致性保证(ACID )o而强化其他一些大型网站更关注的特性:高可用性和可伸缩性。

开源社区有各种NoSQL产品,其支持的数据结构和伸缩特性也各不相同,目前看来, 应用最广泛的是Apache HBaseo

HBase为可伸缩海量数据储存而设计,实现面向在线业务的实时数据访问延迟oHBase的伸缩性主要依赖其可分裂的HRegion及可伸缩的分布式文件系统HDFS实现。

HBase的整体架构如图6.19所示。HBase中,数据以HRegion为单位进行管理,也 就是说应用程序如果想要访问一个数据,必须先找到HRegion,然后将数据读写操作提交 给HRegion,由HRegion完成存储层面的数据操作。每个HRegion中存储一段Key值区间[keyl,key2)的数据,HRegionServer是物理服务器,每个HRegionServer上可以启动多 个HRegion实例。当一个HRegion中写入的数据太多,达到配置的阈值时,HRegion会 分裂成两个HRegion,并将HRegion在整个集群中进行迁移,以使HregionServer的负载均衡。

所有HRegion的信息(存储的Key值区间、所在HRegionServer地址、访问端口号等)都记录在HMaser服务器上,为了保证高可用,HBase启动多个HMaser,并通过Zookeeper ( 一个支持分布式一致性的数据管理服务)选举出一个主服务器,应用程序通 过Zookeeper获得主HMaser的地址,输入Key值获得这个Key所在的HRegionServer地 址,然后请求HRegionServer ±.的HRegion,获得需要的数据。调用时序如图6.20所示。

数据写入过程也是一样,需要先得到HRegion才能继续操作,HRegion会把数据存储 在若干个叫作HFile格式的文件中,这些文件使用HDFS分布式文件系统(参考本书第4 章)存储,在整个集群内分布并高可用。当一个HRegion中数据量太多时,HRegion (连 同HFile )会分裂成两个HRegion,并根据集群中服务器负载进行迁移,如果集群中有新 加入的服务器,也就是说有了新的HRegionServer,由于其负载较低,也会把HRegion迁 移过去并记录到HMaster,从而实现HBase的线性伸缩。


3 小结

伸缩性架构设计能力是网站架构师必须具备的能力。

伸缩性架构设计是简单的,因为几乎所有稍有规模的网站都必须是可伸缩的,有很 多案例可供借鉴,同时又有大量商业的、开源的提供伸缩性能力的软硬件产品可供选用。 然而伸缩性设计又是复杂的,没有通用的、完美的解决方案和产品,网站伸缩性往往和 可用性、正确性、性能等耦合在一起,改善伸缩性可能会影响一些网站的其他特性,网 站架构师必须对网站的商业目标、历史演化、技术路线了然于胸,甚至还需要综合考虑 技术团队的知识储备和结构、管理层的战略愿景和规划,才能最终做出对网站伸缩性架 构最合适的决策。

一个具有良好伸缩性架构设计的网站,其设计总是走在业务发展的前面,在业务需 要处理更多访问和服务之前,就已经做好充足准备,当业务需要时,只需要购买或者租 用服务器简单部署实施就可以了,技术团队亦可高枕无忧。反之,设计和技术走在业务 的后面,采购来的机器根本就没办法加入集群,勉强加了进去,却发现瓶颈不在这里, 系统整体处理能力依然上不去。技术团队每天加班,却总是拖公司发展的后腿。架构师, 对网站伸缩性的把握,一线之间,天堂和地狱。

高手定律:这个世界只有遇不到的问题,没有解决不了的问题,高手之所 以成为高手,是因为他们遇到了常人很难遇到的问题,并解决了。所以百度有 很多广告搜索的高手,淘宝有很多海量数据的高手,QQ有很多高并发业务的 高手,原因大抵如此。一个100万用户的网站,不会遇到1亿用户同时在线的 问题;一个拥有100万件商品网站的工程师,可能无法理解一个拥有10亿件商 品网站的架构。

救世主定律:遇到问题,分析问题,最后总能解决问题。如果遇到问题就 急匆匆地从外面挖一个高手,然后指望高手如探囊取物般轻松搞定,最后怕是 只有彼此抱怨和伤害。许多问题只是看起来一样,具体问题总是要具体对待的, 没有银弹,没有救世主。所以这个定律准确地说应该是“没有救世主定律”。

以上是关于20 数据存储服务器集群的伸缩性设计的主要内容,如果未能解决你的问题,请参考以下文章

20 数据存储服务器集群的伸缩性设计

数据存储服务器集群的伸缩性设计——关系型数据库

应用服务器集群的伸缩性设计

大型网站技术架构,6网站的伸缩性架构之分布式缓存集群的伸缩性设计

19 分布式缓存集群的伸缩性设计

19 分布式缓存集群的伸缩性设计