谈谈 ZooKeeper 的定位：能解决什么问题？不能解决什么问题？

Posted 2021-07-09 javatiange

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了谈谈 ZooKeeper 的定位：能解决什么问题？不能解决什么问题？相关的知识，希望对你有一定的参考价值。

目标

ZooKeeper 很流行，有个基本的疑问：

ZooKeeper 是用来做什么的？
之前没有ZK，为什么会诞生 ZK？

OK，解答一下上面的疑问：（下面是凭直觉说的）

ZooKeeper 是用于简化分布式应用开发的，对开发者屏蔽一些分布式应用开发过程中的底层细节
ZooKeeper 对外暴露简单的 API，用于支持分布式应用开发
ZooKeeper 在提供上述功能的同时，其还是一个高性能、高可用、高可靠的分布式集群

上面说这么多，总结一下，ZK 能解决分布式应用开发的问题，ZK 能很好的解决问题。到这一步，疑问就更多了：

分布式应用开发，有哪些常见问题？ZK 是如何屏蔽这些底层细节的？
ZooKeeper 对外暴露了那些 API？这些 API 如何支持分布式应用开发的？这些 API 还能简化吗？API 的语义性怎么样？
ZooKeeper 自身是一个高性能、高可用、高可靠的分布式集群，那有个简单的问题：
高性能是指什么？ZooKeeper 为了达到高性能，做了哪些工作？
高可用同上
高可靠同上

为什么有 ZooKeeper

一个应用程序，涉及多个进程协作时，业务逻辑代码中混杂有大量复杂的进程协作逻辑。

上述多进程协作逻辑，有 2 个特点：

处理复杂
处理逻辑可重用

因此，考虑将多进程协作的共性问题拎出，作为基础设施，让 RD 更加专注业务逻辑开发，即：

ZooKeeper 就是上述多进程协作基础服务的一种。

ZooKeeper 的特点

ZooKeeper 有几个简单特点：

ZooKeeper 的 API：从文件系统 API 得到的启发，提供简单的 API
ZooKeeper 运行在专用服务器上，跟业务逻辑分离，保证了高容错性和可扩展性

ZooKeeper 是存储设施，但特别注意

ZK上存储的数据聚焦为：协作数据（元数据），而不是应用数据，应用数据有自己的存储方案，例如 HDFS 等
ZK 本质上，可以看作一种特殊的 FS

特别说明：

应用数据和元数据，由于使用场景不同，对一致性和持久性的要求有差异，因此，架构设计、数据治理过程中，应将 2 类数据独立看待、独立存储。

ZooKeeper 的使命

ZK 要解决的核心问题：

ZK 目标：简化分布式应用开发中，多进程协作问题。为分布式应用，提供高效、可靠的分布式协调服务（基础服务），例如：

统一的命名服务
分布式锁
进程崩溃检测
Leader 选举
配置管理：配置变更时，及时下发到各个 Client。

一个简单的问题：多进程的协作是什么？尼玛呀，有完没完，啥问题你都有，面对这个掉咋天的脑壳，还是回答一下。

多进程协作，整体分为 2 类：

协作：多进程需要一同处理某些事情，一些进程采取行动是的其他进程能够正常工作，例如：主从结构，M 向 S 分配任务，S 才会执行，否则 S 就保持空闲状态
竞争：两个进程不能同时工作，一个进程必须等待另个进程执行完毕，例如：主从结构，M 节点失效后，很多 S 都想成为 M，这时，就需要互斥锁，只有第一个获得锁的 S 成为 M

特别说明：

不跨网络协作：多进程，可以在同一台物理主机上，同步原语很方便(比如？管道、共享内存、消息队列、信号量)
跨网络协作：多进程，分布在不同的物理主机上，ZK 关注这一类

跨网络多进程协作，进程通信，基本思路有 2 个：

消息机制：通过网络，直接信息交换，多消息传递算法，实现同步原语
共享存储：利用外部共享存储，实现多进程协作，要求共享存储提供有序访问，ZK 采用这种方式

真实系统中，跨网络通信，有几个共性问题：

消息延迟：由于网络原因，后发送先到达
处理器性能：由于系统调度原因，消息到达后，延迟处理
时钟偏移：不同物理主机，时钟发生偏移

ZooKeeper 特性

ZooKeeper 解决的本质问题

分布式系统的一致性问题：

消息传递：延迟性，先发送的消息，不一定先到达；
消息传递：丢失性，发送的消息，可能丢失；
节点崩溃：分布式系统内，任何一个节点都可能崩溃；

在这种情况下，如何保证数据的一致性？

提案投票：基于投票策略，2PC
选举投票：基于投票策略，投出优先级最高的节点（包含最新数据的节点）

Paxos 目标：解决分布式一致性问题，提高分布式系统容错性的一致性算法。

Paxos 本质：基于消息传递的高度容错的一致性算法

ZooKeeper 定位

ZooKeeper 是：

分布式协调服务
高效、可靠
方便应用程序，聚焦业务逻辑开发，而不需要过多关注分布式进程间协作细节

ZooKeeper 不直接暴露原语，而是，暴露一部分调用方法组成的 API，类似文件系统的 API，支持应用程序实现自己的原语。

ZooKeeper 特性

ZooKeeper 可以保证如下分布式一致性特性：

顺序一致性：同一个 Client 发起的事务请求，严格按照发起顺序执行
原子性：事务请求，要么应用到所有节点，要么一个节点都没有应用
单一视图：Client 无论连接到哪个节点，看到的服务端数据都是一致的（Note：不准确，其实是最终一致性）
可靠性：事务一旦执行成功，状态永久保留
实时性：事务一旦执行成功，Client 并不能立即看到最新数据，但 ZooKeeper 保证最终一致性

如果你觉得自己学习效率低，缺乏正确的指导，可以加入资源丰富，学习氛围浓厚的技术圈一起学习交流吧！
[Java架构群]
群内有许多来自一线的技术大牛，也有在小厂或外包公司奋斗的码农，我们致力打造一个平等，高质量的JAVA交流圈子，不一定能短期就让每个人的技术突飞猛进，但从长远来说，眼光，格局，长远发展的方向才是最重要的。