HBase为什么依赖Zookeeper

本篇内容主要讲解“HBase为什么依赖Zookeeper”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“HBase为什么依赖Zookeeper”吧!一、ZooKeeper相关知识：概念： Zookeeper是一个分布式应用程序协调服务，提供了简单易用的接口和性能高效、功能稳定的系统让用户可以很轻松解决分布式应用程序下面的出现的协调服务，确保避免出现竞态条件或者死锁等错误。其设计目标是减轻分布式应用从零开始实现分布式协调服务的压力。假设我们的程序是分布式部署在多台机器上，如果我们要改变程序的配置文件，需要逐台机器去修改，非常麻烦，现在把这些配置全部放到zookeeper上去，保存在 zookeeper 的某个目录节点中，然后所有相关应用程序对这个目录节点进行监听，一旦配置信息发生变化，每个应用程序就会收到 zookeeper 的通知，然后从 zookeeper 获取新的配置信息应用到系统中。数据节点(znode)： Zookeeper维护一个类似文件系统的数据结构，每一个节点是指数据模型中的数据单元，称为ZNode。ZooKeeper将所有数据存储在内存中，数据模型是一棵树（ZNode Tree），由斜杠（/）进行分割的路径，就是一个ZNode，如/hbase-unsecure/replication,其中hbase-unsecure和replication都是ZNode。每个ZNode上都会保存自己的数据内容，同时会保存一系列属性信息。每个znode由三部分组成。stat：状态信息，描述该znode的版本，权限等信息data：与该znode关联的数据children：该znode下的子节点zkCli.sh使用：
ZooKeeper提供了一个交互式shell，允许各种Znode操作，就像在典型的文件系统中一样。还可以使用get命令获得关于znode内容的一些信息。两种方式：zkCli客户端中输入 help 命令（其实输入任何 zkCli 不能识别的命令，都会列出所有的命令），查看可用的命令：有几个比较重要的命令我这里结合HBase的znode简单说一下，其他命令请自行百度：create：在树中的某个位置创建一个节点。
delete：删除一个节点。
exists：测试一个节点是否存在。
get data：读取节点数据。
set data：向节点中写入数据。
get children：检索某节点的子节点列表。
sync：等待要传播的数据。这里专门说下get path 获取节点信息另外一个命令：sync pathsync方法会强制客户端所连接的服务器状态与leader的状态同步，这样在读取 path 的值就是最新的值了。HBase主要用ZooKeeper来实现HA选举与主备集群主节点的香港云主机切换、系统容错、RootRegion管理、Region状态管理和分布式SplitWAL任务管理等。1).HA管理：集群的主节点的选举和主备的切换跟Hadoop中Namnode的HA的选举和切换机制类似（后面我会专门写一篇文章讲解Namenode的HA）。2).RegionServer管理： HBase集群启动时，每台RegionServer在Zookeeper中/hbase-unsecure/rs注册一个自己的临时节点，HMaster会利用这些临时节点来发现可用RegionServer，还可以利用临时节点来跟踪及其故障和网络分区。这些临时节点相当于一个“会话”，会话是客户端链接上Zookeeper服务器之后自动生成的。每个会话有一个唯一的id，RegionServer会用这个id不断向Zookeeper服务器发送“心跳”，一旦RegionServer发生故障，发送心跳则会停止，当超过限定时间后，Zookeeper服务器会判定会话超时，并自动删除属于它的临时会话。与此同时，HMaster 则会接收到 ZooKeeper 的 NodeDelete 通知，从而感知到某个节点断开，并立即开始容错工作。备注：
为啥选择zookeeper干这个事？因为随着集群节点越来越多，HMaster的管理负担会越来越重，另外它自身也有挂掉的可能，因此数据还需要持久化，zookeeper通常是一个集群，这样稳定性相对就高了很多。3).元数据Region：每次客户端向HBase发起请求时，都会去查询元数据Region,默认目录是：/hbase-unsecure/meta-region-server,如果发生region的迁移，zookeeper都会进行试试更新，以便其他客户端请求时，总能查到最新的RootRegion信息。4).Region管理：的状态经常会发生变更，比如Region迁移、上线、离线，都是通过zookeeper来统一管理的。5).预写日志恢复 RegionServer经常会通过WAL预写日志进行数据的恢复，由于RegionServer数据量比较大，单个节点进行恢复速度比较慢，HMaster会把WAL预写日志进行切分，放到Zookeeper的/hbase-unsecure/splitWAL目录中，让其他的RegionSever都能参与日志的恢复工作，提升恢复速度。ZooKeeper在这里担负起了分布式集群中相互通知和信息持久化的角色。三、HBase的znode HBase在zookeeper的znode的根节点是通过hbase-site.xml中的“zookeeper.znode.parent”属性进行配置的（/hbase-unsecure），每次HBase集群重启znode都会重建，所以如果集群重启的话，重启之前直接删除/hbase-unsecure也是没有问题的。下面就具体讲解下HBase在ZooKeeper中znode目录结构：replication：meta-region-server：HBase元数据表Region位置信息，在哪个Regionsever上;
rs：RS的临时节点,应该是只有在线RegionServer节点，宕机、掉线没有。splitWAL：WAL预写分割工作分配目录backup-masters:备用HMaster节点
table-lock: flush-table-proc:flush进程
region-in-transition:处于RIT状态的region
online-snapshot: 快照
master:激活HMaster节点balancer: 正在进行balance的节点
recovering-regions:正在恢复的regionnamespace：HBase集群所有命名空间
hbaseid：HBase集群的唯一ID
table：集群中各个表信息
到此，相信大家对“HBase为什么依赖Zookeeper”有了更深的了解，不妨来实际操作一番吧！这里是开发云网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！

相关推荐: 好程序员大数据学习路线分享Scala系列之基础篇

好程序员大数据学习路线分享Scala系列之基础篇了解ScalaScala 是 Scalable Language 的简写，是一门多范式的编程语言。Scala设计的初衷是要集成面向对象编程和函数式编程的各种特性。Scala运行于Java平台（Java虚拟机），并…

免责声明：本站发布的图片视频文字，以转载和分享为主，文章观点不代表本站立场，本站不承担相关法律责任；如果涉及侵权请联系邮箱：360163164@qq.com举报，并提供相关证据，经查实将立刻删除涉嫌侵权内容。