Hadoop_简单操作ZooKeeper

Posted 2020-08-15

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Hadoop_简单操作ZooKeeper相关的知识，希望对你有一定的参考价值。

一、概念

　　1. 一个开源的、分布式的,为分布式应用提供协调服务的Apache项目

　　2. 提供一个简单的原语集合,以便于分布式应用可以在它之上构建更高层次的同步服务

　　3. 设计非常易于编程,它使用的是类似于文件系统那样的树形数据结构

　　4. 目的是将分布式服务不再需要由于协作冲突而另外实现协作服务

　　5. 项目由Java语言开发,并提供了很多API

　　6. 官方网站:http://zookeeper.apache.org

　　7. 分布式:最少三个节点(节点数必为奇数个,即2n+1个节点,n为允许宕掉的节点数目)
　　　　1> Zookeeper服务启动时,会进行"选举"操作,即leader与follower,并进行监控
　　　　2> 领导者leader:为了在分布式环境中保证数据一致性,负责进行投票和发起决议,更新系统状态
　　　　3> 跟随者follower:用于接收客户请求并向客户端返回结果,在选主过程中参与投票
　　　　4> 观察者Observer:可以接受客户端连接,将请求发给leader,但不参与选主,只同步leader状态
　　　　　 Observer的目的是为了扩展系统,提高读取速度
　　　　5> 客户端client:请求发起方
　　　　6> 数据存放在内存中与本地,使用内存读取速度更快
　　　　7> 其下的客户端可连接任意一个server(server与client关系:多对多)
　　　　8> 允许宕机具有容错性

　　8. Zookeeper从设计模式看是一个基于观察者模式设计的分布式服务管理框架,负责存储和管理重要的数据,
　　　然后接受观察者的注册,一旦数据发生变化,Zookeeper负责通知注册的观察者并做相应处理,
　　　从而实现类似与Msater与slaver的管理模式,应用场景:
　　　　1> 统一命名服务(Name Service)
　　　　2> 硬盘管理(Configuration Management)
　　　　3> 集群管理(Group Membership)
　　　　4> 共享锁(Locks)、同步锁

二、单机模式
　　　　1> 下载zookeeper-3.4.6.tar.gz 并上传至指定目录
　　　　2> 解压并重命名其中的conf/zoo_sample.cfg为zoo.cfg
　　　　3> 修改其中dataDir属性为自定义路径
　　　　4> 回到项目主目录使用bin/zkServer.sh start启动项目
　　　　5> jps查看后多出一个QuorumPeerMain进程
　　　　6> 使用bin/zkCli.sh打开客户端

[zk: localhost:2181(CONNECTED) 1] ls /
[zookeeper]
[zk: localhost:2181(CONNECTED) 2] ls /zookeeper     　　　 # 查看zookeeper
[quota]
[zk: localhost:2181(CONNECTED) 3] get /zookeeper    　　　 # 获取其中信息
cZxid = 0x0
ctime = Thu Jan 01 08:00:00 CST 1970
mZxid = 0x0
mtime = Thu Jan 01 08:00:00 CST 1970
pZxid = 0x0
cversion = -1
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 0
numChildren = 1
[zk: localhost:2181(CONNECTED) 4] create /test "123456"　　# 创建一个文件(目录)并赋予其值
Created /test
[zk: localhost:2181(CONNECTED) 5] ls /
[test, zookeeper]
[zk: localhost:2181(CONNECTED) 6] get /test
"123456"
cZxid = 0x4
ctime = Thu Oct 20 00:12:25 CST 2016
mZxid = 0x4
mtime = Thu Oct 20 00:12:25 CST 2016
pZxid = 0x4
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 8
numChildren = 0
[zk: localhost:2181(CONNECTED) 7] rmr /test　　　　　　　　　# 删除该文件
[zk: localhost:2181(CONNECTED) 8] ls /
[zookeeper]
[zk: localhost:2181(CONNECTED) 9]

三、分布式模式

PS:在部署Zookeeper分布式模式之前需要先后关闭Zookeeper相关进程:
quit->退出客户端
bin/zkServer.sh stop -> 关闭服务

　　　　1> 准备三个节点
　　　　2> 选取其中一台,上传并解压Zookeeper
　　　　3> 重命名Zookeeper
　　　　5> 修改本地数据存储路径 -> 属性dataDir
　　　　6> 添加三个节点服务:格式 -> server.1=hadoop09-linux-01.ibeifeng.com:2888:3888
　　　 7> 在你的dataDir目录下建立myid文件并录入1(1表示计算机编号,其他两台以此类推)
　　　 8> scp 命令分发zookeeper文件夹到其他两个节点并依次修改myid机器码
　　　 9> 分别在zookeeper主目录下使用bin/zkServer.sh start 命令启动服务,
　　　 10> 每个节点使用jps查看一下进程,再使用bin/zkServer.sh status命令查看当前server选主结果
　　　 11> 可以打开客户端测试使用
　　

以上是关于Hadoop_简单操作ZooKeeper的主要内容，如果未能解决你的问题，请参考以下文章

ZK集群搭建和Hadoop单机版及Java API简单操作

HBase学习01（HBase入门及HBase Shell简单操作）

Zookeeper客户端java代码操作

Hbase_入门配置