初识分布式架构

Posted 经典技术架构

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了初识分布式架构相关的知识,希望对你有一定的参考价值。

经典架构技术文章第一时间送达!

分布式架构的常见概念

集群 
小饭店原来只有一个厨师,切菜洗菜备料炒菜全干。后来客人多了,厨房一个厨师忙不过来,又请了个厨师,两个厨师都能炒一样的菜,这两个厨师的关系是集群。 


分布式 
为了让厨师专心炒菜,把菜做到极致,又请了个配菜师负责切菜,备菜,备料,厨师和配菜师的关系是分布式,一个配菜师也忙不过来了,又请了个配菜师,两个配菜师关系是集群。 

初识分布式架构


节点 
节点是指一个可以独立按照分布式协议完成一组逻辑的程序个体。在具体的项目中,一个节点表示的是一个操作系统上的进程。

 
副本机制 
副本(replica/copy)指在分布式系统中为数据或服务提供的冗余。 
数据副本指在不同的节点上持久化同一份数据,当出现某一个节点的数据丢失时,可以从副本上读取到数据。(张三请假了,李四负责顶替张三的工作)数据副本是分布式系统中解决数据丢失问题的唯一手段。 
服务副本表示多个节点提供相同的服务,通过主从关系来实现服务的高可用方案。 


中间件 
中间件位于操作系统提供的服务之外,又不属于应用,他是位于应用和系统层之间为开发者方便的处理通信、输入输出的一类软件,能够让用户关心自己应用的部分。


架构的发展过程

一个成熟的大型网站系统架构并不是一开始就设计的非常完美,也不是一开始就具备高性能、高可用、安全性等特性,而是随着用户量的增加、业务功能的扩展逐步完善演变过来的。在这个过程中,开发模式、技术架构等都会发生非常大的变化。 


阶段一,单应用架构 
网站的初期也可以认为是互联网发展的早起,我们经常会在单机上跑我们所有的程序和软件。把所有软件和应用都部署在一台机器上,这样就完成一个简单系统的搭建,这个时候讲究的是效率。 

初识分布式架构


阶段二,应用服务器和数据库服务器分离 
随着网站的上线,访问量逐步上升,服务器的负载慢慢提高,在服务器还没有超载的时候,我们应该做好规划,提升网站的负载能力。假如代码层面的优化已经没办法继续提高,在不提高单台机器的性能,增加机器是一个比较好的方式,投入产出比非常高。这个阶段增加机器的主要目的是将web服务器和数据库服务器拆分,这样不仅提高了单机的负载能力,也提高了容灾能力。 

初识分布式架构


阶段三,应用服务器集群 
随着访问量的继续增加,单台应用服务器已经无法满足需求。在假设数据库服务器还没有遇到性能问题的时候,我们可以增加应用服务器,通过应用服务器集群将用户请求分流到各个服务器中,从而继续提升负载能力。此时多台应用服务器之间没 
有直接的交互,他们都是依赖数据库各自对外提供服务。

初识分布式架构


架构发展到这个阶段,各种问题也会慢慢呈现: 
1. 用户请求由谁来转发到具体的应用服务器。 
2. 用户如果每次访问到的服务器不一样,那么如何维护session。 

初识分布式架构


阶段四,数据库压力变大,数据库读写分离 
架构演变到这里,并不是终点。上面我们把应用层的性能提上来了,但是数据库的负载也在慢慢增大,那么怎么去提高数据库层面的负载呢?有了前面的思路以后,自然会想到增加服务器。但是假如我们单纯的把数据库一分为二,然后对于后续数据库的请求,分别负载到两台数据库服务器上,那么一定会造成数据库不统一的问题。所以我们一般先考虑读写分离的方式。 

初识分布式架构


这个架构的变化会带来几个问题: 
1. 主从数据库之间的数据同步,可以使用 mysql 自带的master-slave方式实现主从复制。 
2. 对应数据源的选择,采用第三方数据库中间件,例如 mycat。 

阶段五,使用搜索引擎缓解读库的压力 
数据库做读库的话,常常对模糊查找效率不是特别好,像电商类的网站,搜索是非常核心的功能,即便是做了读写分离,这个问题也不能有效解决。那么这个时候就需要引入搜索引擎了,使用搜索引擎能够大大提高我们的查询速度,但是同时也会带来一些附加的问题,比如维护索引的构建。 

初识分布式架构


阶段六,引入缓存机制缓解数据库的压力 
随着访问量的持续增加,逐渐出现许多用户访问同一部分内容的情况,对于这些热点数据,没必要每次都从数据库去读取,我们可以使用缓存技术,比如 memcache、redis 来作为我们应用层的缓存。另外在某些场景下,比如我们对用户的某些IP的访问频率做限制,那这个放内存中又不合适,放数据库又太麻烦,这个时候可以使用Nosql的方式,比如mongDB来代替传统的关系型数据库。 

初识分布式架构


阶段七,数据库的水平/垂直拆分 
我们网站演进的变化过程,交易、商品、用户的数据都还在同一个数据库中,尽管采取了增加缓存,读写分离的方式,但是随着数据库的压力持续增加,数据库的瓶颈仍然是个最大的问题,因此我们可以考虑对数据进行垂直拆分和水平拆分。 
垂直拆分:把数据库中不同业务数据拆分到不同的数据库。 

初识分布式架构

水平拆分:把同一个表中的数据拆分到两个甚至更多的数据库中,水平拆分的原因是某些业务数据量已经达到了单个数据库的瓶颈,这时可以采取将表拆分到多个数据库中。

初识分布式架构


阶段八,应用的拆分 
随着业务的发展,业务越来越多,应用的压力越来越大,工程规模也越来越庞大。这个时候就可以考虑将应用拆分,按照领域模型将我们的用户、商品、交易拆分成多个子系统。

初识分布式架构

这样拆分以后,可能会有一些相同的代码,比如用户操作,在商品和交易都需要查询,所以会导致每个系统都会有用户查询访问相关操作。这些相同的操作一定是要抽象出来,否则就会是一个坑。所以通过走服务化路线的方式来解决。 

初识分布式架构

那么服务拆分以后,各个服务之间如何进行远程通信呢? 
通过 RPC技术,比较典型的有:webservice、hessian、http、RMI等等。前期通过这些技术能够很好的解决各个服务之间通信问题,但是互联网的发展是持续的,所以架构的演变和优化还在持续。

架构全局图

初识分布式架构


如需查看更多技术架构文章,长按下面二维码关注,获取大量经典架构技术,让我们一起学习架构技术支持,成长为架构师。

经典技术架构

ID:tuhao_programer

互联网 | 海量高可用 | 应用技术架构丨大数据丨机器学习 | 云计算   


以上是关于初识分布式架构的主要内容,如果未能解决你的问题,请参考以下文章

初识Hadoop架构

一文归纳总结分布式架构的那些事!

一文归纳分布式架构的那些事!

一文归纳总结分布式架构中的那些事!

dubbo初识Dubbo架构设计详解

初识Hadoop